Llama - 搜索 News

2 天

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

众所周知，近期发布的 OpenAI o1 在数学、代码、长程规划等问题上取得了显著提升，而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此，有人认为，新的扩展律 —— 后训练扩展律（Post-Training Scaling ...

1 天

走出元宇宙阴影、拥抱开源AI模型，Meta实现“扎克伯格式复兴”

Meta首次尝试推出的AI项目并未取得显著进展。2022年11月，FAIR发布了名为Galactica的聊天机器人，它基于大语言模型构建，并接受了科学文本的训练。与以往的FAIR模型一样，Galactica也是以开源形式发布的，旨在让研究人员深入了解 ...

腾讯网7 小时

1行代码改进大模型训练，Llama训练速度升至1.47倍，华人团队出品

优化器选用了AdamW和Lion，以及它们对应的Cautious版本:C-AdamW和C-Lion，每个实验中进行1万步迭代。尤其是在1B规模上，相比原版的AdamW和Lion，它们的样本效率分别提高了47%和28%，这表明Cautious ...

腾讯网1 天

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

除了人类评审员，VibeCheck还调用了GPT-4o mini来评价不同大模型的回复，结果发现与人类的评估结果相符。也就是说，GPT-4o mini也能发现上述人类评审员总结的细微差异。

1 天

大模型MBTI性格揭示：Llama更敢说，GPT-4却像理工男

随着人工智能技术的飞速发展，越来越多的人开始把目光投向大型语言模型（LLM）的表现与个性。最近，加州大学伯克利分校进行了一项引人注目的研究，探索了不同大型模型间的性格差异，并采用类似于MBTI性格测试的方法来进行评估。这一研究的核心在于揭示：这些智能体是不是具备独特的个性？在当前的AI应用中，这一问题显得尤为重要。

22 天

LLaMA版o1大模型发布：上海AI Lab的开源突破与创新探索

近日，来自上海AI Lab的LLaMA版o1大模型正式发布，标志着在大规模语言模型领域的一次重要进展。这一模型的推出不仅仅是复刻OpenAI的o1推理大模型，更在算法和技术实现上进行了显著的创新。LLaMA版o1凭借其深入的强化学习策略，特别是蒙特卡洛树搜索与自我对弈的结合，为模型的数学推理能力提供了新的可能性。背景上，o1大模型的发布是在2024年6月，AI Lab团队对其进行了深度探索，并在 ...

21 天

重磅！LLaMA-O1复刻OpenAIo1：开启人工智能新纪元

在人工智能的快速发展中，最近一项激动人心的成果浮出水面——LLaMA-O1的发布。这款复刻自OpenAIo1推理大模型的开源项目，来自上海人工智能实验室（AILab），采用了强化学习的全新代码架构。这一项目不仅吸引了广泛关注，还为大规模人工智能模型的数学推理能力的提升提供了新的思路和资源。

3 天

Meta 挖角 Salesforce AI 首席执行官史宗玮，令其领导人工智能商业部门 ...

Meta 副总裁 John Hegeman 向外媒表示，全球风靡的 AI 热潮为企业商业部门带来了重要机遇，人们可以使用 AI 提高效率和改善客户体验，由史宗玮领导的人工智能商业部门团队将进一步 Llama 模型应用，协助 Meta 实现这一愿景。

Mobile World Live23 天

中国研究人员采用Meta AI Llama模型

据报道，与军方有联系的中国研究机构利用Meta 平台的开源Llama模型开发了AI系统来收集和处理情报。路透社报道称，它阅读的论文表明，研究人员使用了Meta平台的 Llama ...

1 天on MSN

Orange携手OpenAI、Meta，打造专属非洲语言AI模型

法国电信巨头Orange近日宣布了一项重要合作计划，旨在推动非洲地区语言的人工智能发展。这一计划是与微软支持的OpenAI和Facebook母公司meta共同展开的。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果