洛谷 Dataset 代码征集公告
  • 板块站务版
  • 楼主kkksc03吉祥物
  • 当前回复2198
  • 已保存回复2232
  • 发布时间2024/6/21 23:16
  • 上次更新2024/8/25 16:09:30
查看原帖
洛谷 Dataset 代码征集公告
1
kkksc03吉祥物楼主2024/6/21 23:16

update:已经收集到了足够的用户授权。我们将逐步整理代码。

为了推动算法竞赛领域的学术研究和 AI 模型的发展,洛谷决定开放一个数据集项目。该项目旨在挑选一些经典的算法竞赛题目,公开题面和测试数据,并提供大量用户提交的代码。这个数据集将作为 LLM(大型语言模型)的训练和评估的 testbench,面向学术界开放使用。

我们诚挚地邀请各位洛谷用户成为我们的志愿者,共同参与这个项目的建设。

我们需要什么?

我们需要您授权洛谷整理您提交的部分题目的代码(C++ 和 Python),包括这些题目:

您只需要在本贴回复任意内容,则视为授权提供您的代码。回帖后 5 分钟内,你可以选择删除回复,超过 5 分钟则无法撤回。

等一段时间后,我们会收集经过授权的用户代码,经过整理、脱敏后公开。

公开的数据集会有哪些内容

  • 题目的题面(中文/英语)和测试数据
  • 用户提供的代码
  • 评测记录表格(经过离散化后的用户ID、题目编号、评测状态)

数据集公布时,会展示贡献者的用户名,以示感谢(也可以选择匿名)。

我们相信,这个数据集将成为推动算法竞赛和 AI 领域发展的重要资源。感谢大家的贡献。

2024/6/21 23:16
加载中...