发布于 2023-11-22 15:37:43 | 阅读 12560
不久前,外界对百川智能开源模型Baichuan-7B同样提出了是否套壳LLaMa的质疑。彼时,王小川表示,搜索公司干了20年,团队对语言数据有深入的理解,知道取得高质量语料的渠道,模型迭代速度很快,“国内开源模型的能力目前已经可以达到LLaMa”。
发布于 2023-08-29 13:43:26 | 阅读 11652
Meta 于周四宣布推出一种名为 Code Llama 的大型语言模型(LLM),它可以使用文本提示来生成和讨论代码。
发布于 2023-07-25 14:33:15 | 阅读 17793
上个周末,Karpathy 花了整个周六来忙一个 Llama2 的有趣项目
发布于 2023-07-19 15:07:39 | 阅读 16091
已上微软 Azure,即将要上 AWS、Hugging Face。据介绍,相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。
发布于 2023-07-19 14:55:35 | 阅读 16987
Meta在大语言模型方面和微软强强联手,向谷歌和OpenAI发起了新的挑战
发布于 2023-03-07 14:42:27 | 阅读 18990
前几周,Meta发布了自家的大型语言模型LLaMA,参数量从70亿到650亿不等。