注册即时通讯云 注册客服云
大模型迎来「开源季」,盘点过去一个月那些开源的LLM和数据集

发布于 2023-05-16 17:01:58 | 阅读 13301

开源的力量正在源源不断地影响着整个 AI 社区,无论是 LLM 还是数据集。本文作者 Sebastian Raschka 对相关资源进行了汇总,并分享了自己的洞见。

谷歌开源首个「方言」数据集:让机器翻译更地道

发布于 2023-02-28 14:34:05 | 阅读 17711

研究人员根据博客和教育网站手动收集了20-30个具有地区特色的翻译术语,并根据来自每个地区的母语志愿者的反馈对翻译进行过滤和审核。

16万视频对、28万对片段,蚂蚁开源视频侵权检测超大数据集

发布于 2022-05-07 10:50:32 | 阅读 18815

该研究提出了目前最大规模(超过现有其他数据集 2 个数量级规模)的视频侵权定位数据集VCSL,并提出全新的视频片段拷贝检测的评价指标。相关研究入选CVPR 2022。

世界上最大的多语言语音数据集开源,共23种语言超40万小时

发布于 2021-08-09 11:13:36 | 阅读 20110

Facebook开源了目前世界上最大的多语言语音数据集,VoxPopuli。

Google开源ToTTo数据集,你的模型还「撑」得住吗?

发布于 2021-01-20 17:16:52 | 阅读 19753

近日,Google研究人员提出一个大型从表转换到文本的英文数据集,已经在Git上开源。

从新冠数据集到AutoML库集,值得学习的数据科学项目

发布于 2020-04-30 13:44:54 | 阅读 23753

像这样的官方要求之下未知期限的集体休假,确实是极为罕见的。这样的“封锁”或许让你崩溃,孤独感和经济压力可能正在袭来。但也不完全是坏事,尤其当你计划提高数据科学组合能力,并想要在危机后,得到一份可靠且与行业相关的简历的时候!

用于文本分类的10大开源数据集:Amazon Reviews Dataset居首

发布于 2020-03-23 11:44:26 | 阅读 65372

本文列出了可用于文本分类的10个开源数据集,按首字母顺序介绍。

史上最全的25个深度学习的开放数据集汇总

发布于 2018-04-11 16:14:03 | 阅读 56216

还在发愁找不到数据集训练你的模型?快来收藏一下史上最全的深度学习数据集汇总吧,有它在,一切都ok~

    周排行

    申请试用

    提交后工作人员会尽快与您联系进行功能演示
    技术咨询已转移到管理后台,请先登录

    即时通讯云使用者请在应用详情页面咨询
    客服云使用者请进入管理员模式咨询

    ×

    在线咨询

    电话咨询

    微信咨询

    注册客服

    注册IM