感谢用户提供的建议,根据洛谷的 RMJ 评测量评估、目前的情况以及实践测试,以下方案认为不可行:
以下方案具有可行性,但是需要我们一定的时间处理:
近期包括洛谷在内的多个 OJ 加强了其防御服务的强度,以避免大量 AI 和爬虫对网站造成的危害,导致洛谷爬虫无法顺利爬取提交记录。
再次强调,RemoteJudge 服务的稳定性无法得到保证,它只是为了方便大家更顺畅地提交国外 OJ。但由于各种原因,我们无法保证这项服务的稳定性。我们会尽力保证题目爬取的稳定性,至少能够提供稳定的中文题面和题解,以便用户训练。
更多详细信息请参考:https://help.luogu.com.cn/manual/luogu/problem/remote-judge
hp
以下方案是否可行?
@Grammar_hbw 应该较难。
我觉得问题不在于爬不了,而是洛谷庞大的评测量基数导致CF察觉不对直接给爬虫ban出去。
@2028 也对,毕竟洛谷的用户量和 hydro、duel、vjudge以及各大校内oj 不是一个级别的。
not qp and not zc
@Grammar_hbw 其实有一个方案,CF的题搬过来,然后让谷民众筹数据自行评测,但坏处在于难以建立一个完善的评测数据收集审核和应用机制,并且可能会出现泄露数据导致面向数据编写代码的情况(
收集还相对好办,审核的话可以谷民交代码投票这样的?至于面向数据编程可以用AI检测?
@Grammar_hbw 那和上面给出评测 id 然后爬取有啥区别
@2028 我觉得不太可行
@2028 应该可以吧,而且还不用那么多数据,只需要那些卡住很多人的数据就可以了。不过会不会有人乱提供数据,而且很多大数据是加载不出来的。