发布于 2023-05-16 17:01:58 | 阅读 13301
开源的力量正在源源不断地影响着整个 AI 社区,无论是 LLM 还是数据集。本文作者 Sebastian Raschka 对相关资源进行了汇总,并分享了自己的洞见。
发布于 2023-02-28 14:34:05 | 阅读 17711
研究人员根据博客和教育网站手动收集了20-30个具有地区特色的翻译术语,并根据来自每个地区的母语志愿者的反馈对翻译进行过滤和审核。
发布于 2022-05-07 10:50:32 | 阅读 18815
该研究提出了目前最大规模(超过现有其他数据集 2 个数量级规模)的视频侵权定位数据集VCSL,并提出全新的视频片段拷贝检测的评价指标。相关研究入选CVPR 2022。
发布于 2021-08-09 11:13:36 | 阅读 20110
Facebook开源了目前世界上最大的多语言语音数据集,VoxPopuli。
发布于 2021-01-20 17:16:52 | 阅读 19753
近日,Google研究人员提出一个大型从表转换到文本的英文数据集,已经在Git上开源。
发布于 2020-04-30 13:44:54 | 阅读 23753
像这样的官方要求之下未知期限的集体休假,确实是极为罕见的。这样的“封锁”或许让你崩溃,孤独感和经济压力可能正在袭来。但也不完全是坏事,尤其当你计划提高数据科学组合能力,并想要在危机后,得到一份可靠且与行业相关的简历的时候!
发布于 2020-03-23 11:44:26 | 阅读 65372
本文列出了可用于文本分类的10个开源数据集,按首字母顺序介绍。
发布于 2018-04-11 16:14:03 | 阅读 56216
还在发愁找不到数据集训练你的模型?快来收藏一下史上最全的深度学习数据集汇总吧,有它在,一切都ok~