information - gitok

专家模型不要专家并行！微软开源MoE新路径

2024-11-11 22:27

微软研究人员开源了新型MoE大模型GRIN，采用独特训练方法，在编码和数学任务中表现优异。GRIN模型运用SparseMixer-v2精确估计专家路由梯度，并采用数据、pipeline和张量并行进行训练，避免了传统MoE训练中的token丢弃问题，实现了超过80%的训练效率提升。

两位本科生一作，首次提出「持续学习」+「少样本」知识图谱补全 | CIKM 2024

2024-11-11 22:27

上海大学本科生研发的新框架有效应对知识图谱补全中的灾难性遗忘和少样本学习难题，提升模型在动态环境和数据稀缺场景下的应用能力。该研究为领域发展提供推动，为实际应用提供参考。研究提出的方法包括三元组记忆回放、参数调制和自监督多视角关系增强技术，有效解决了知识图谱补全中的关键问题。

清华团队破解具身智能Scaling Law，GPT时刻在即！宁德时代联创终于出手

2024-11-11 22:27

具身智能公司千寻智能半年内完成三次大额融资，成为该领域明星企业。柏睿资本独家投资，看重千寻在AI、硬件、商业化三方面的优势。千寻智能展示了其机器人精准操作能力，如分类糖豆、抓鸡蛋等。同时，公司团队发现具身智能领域的“圣杯”——Data Scaling Laws，实现机器人零样本泛化，推动通用机器人开发。

奥特曼自曝OpenAI掌握AGI密钥，2025年降临！1人1万块GPU造十亿独角兽

2024-11-11 22:27

OpenAI CEO奥特曼在专访中提出，AGI将于2025年到来，ASI则将在几千天内降临。他认为现在是创办科技公司的最佳时机。其言论得到了德扑之父和OpenAI员工的证实。奥特曼还讨论了OpenAI的发展路径和AGI的五个级别，强调创业公司应利用AI技术的快速发展，同时遵循商业基本规则。

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技

2024-11-11 22:27

外媒爆料OpenAI下一代旗舰模型Orion性能提升放缓，引发关于大模型Scaling Law是否撞墙的争论。多位OpenAI研究人员辩称Scaling Law未遇瓶颈，强调推理计算的新维度将解锁模型新能力。此次争议围绕AI发展前景，有人质疑LLM通向AGI的可能性，但OpenAI团队表示将继续探索新方法提升模型性能。

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

2024-11-11 22:27

首个开源检索增强框架SearchLVLMs诞生，可无缝整合多模态大模型，实现免微调接入互联网，提升模型对实时信息的反馈能力。该框架效果超越闭源方案，准确率显著提高，为实时信息处理提供新的解决方案。

ChatGPT新玩法火了：一句话画出你的真实生活，大神Karpathy玩上了

2024-11-11 22:27

ChatGPT新玩法引发关注，用户只需一句话描述生活，AI就能画出对应场景。知名技术专家Karpathy尝试后表示画作相当准确。此玩法不仅展现AI记忆功能，还能引发用户对自我生活的思考，但也存在不准确的情况。

GPT-5被曝不及预期，OpenAI员工：没什么科学突破了，只需要工程

2024-11-11 22:27

OpenAI下一代旗舰模型“猎户座”提升幅度不如预期，有员工表示科学创新较少，主要需要工程改进。业界担忧AI行业可能进入收益递减阶段，面临价格战和利润压力。尽管如此，OpenAI CEO奥特曼仍对2025年实现AGI表示乐观。同时，公司人才流动和技术进展情况引发关注。

o1/Claude集体翻车！陶哲轩等60+顶尖数学家合力提出新数学基准

2024-11-11 22:27

60余位顶尖数学家联合提出新数学基准FrontierMath，挑战AI数学解题能力， Claude 3.5 Sonnet、GPT-4o等大模型解题率不足2%。该基准由非营利研究机构Epoch AI发起，旨在评估AI高级数学推理能力，包含数百道原创题目，涉及现代数学多个分支。AI专家卡帕西对此表示赞赏，认为需更多此类基准挑战AI能力。

用LLM一键生成百万级领域知识图谱！中科大新框架入选ACL 2024

2024-11-11 22:27

中科大MIRA实验室提出新框架SAC-KG，可一键生成百万级领域知识图谱，较SOTA方法提升20%。该框架以ChatGPT为基础模型，利用生成器、验证器和剪枝器三个组件，实现自动化、精确性和可控性的知识图谱构建。相关成果已发表在ACL 2024 Main会议。

字节豆包通用图像编辑模型SeedEdit开启测试用户可一句话轻松改图

2024-11-11 22:27

字节跳动豆包大模型团队推出国内首个产品化通用图像编辑模型SeedEdit，支持通过自然语言进行图像的一键编辑，如修图、换装等，已在豆包PC端和即梦网页端测试。SeedEdit强调在维持原图与生成新图之间取得平衡，采用新模型架构和数据方案解决数据稀缺问题，表现出通用性、可控性与高质量优势，显著优于其他编辑模型，为图像编辑带来新突破。未来，SeedEdit将继续优化，提升用户体验。

OpenAI大改下代大模型方向，scaling law撞墙？AI社区炸锅了

2024-11-11 22:27

行业巨头OpenAI可能正在面临大模型scaling law的极限，有研究预测2028年数据储量或被用完，导致发展放缓。然而，OpenAI策略转变，聚焦模型训练后提升。报道指出，OpenAI下一代模型提升幅度不如前，但内部人士和研究者对此表示争议。有人认为，AI发展不会放缓，而推理时间计算可能成为新的性能提升来源。OpenAI的内部动态和产业界的反应引发了广泛讨论。

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

2024-11-11 22:27

机器之心AIxiv专栏介绍了一个名为AutoHallusion的视觉大模型幻觉自动生成框架，旨在解决大型视觉语言模型中的“幻觉”现象。研究团队通过插入异常物体等策略，自动生成幻觉案例，实验显示GPT-4V等模型准确率仅66.0%。该框架有助于缓解数据集缺乏问题，提高模型在自动驾驶等领域的应用安全性。

GitHub超火开发者路线图库有AI学习路线了！star数近30万

2024-11-11 22:27

AI学习资源库“开发者路线图”提供超过50个领域的学习路线图，包含AI工程师、数据科学家等专题，助力开发者规划学习路径。自2017年启动，该资源库在GitHub上获得近30万star，提供从基础到高阶的教程和资源，帮助用户在AI大时代中不迷失方向。

LoRA、完全微调到底有何不同？MIT 21页论文讲明白了

2024-11-11 22:27

MIT研究者比较了两种微调大型语言模型的方法：完全微调和低秩自适应（LoRA）。研究发现，尽管LoRA在任务性能上可匹敌完全微调，但它们在参数更新和模型泛化行为上有显著差异。LoRA引入了“侵入维度”，导致模型在预训练分布上忘记更多，且泛化能力较差。研究指出，LoRA在低秩时适合任务，但高秩可能更优，需确保秩稳定性。与完全微调相比，LoRA的限制更大，因为它失去了泛化能力。

真·打字P图！字节发布新模型SeedEdit，一句话爆改世界名画，可免费体验

2024-11-11 22:27

字节跳动豆包大模型团队推出国内首个产品化通用图像编辑模型SeedEdit，主打一句话轻松P图，支持自然语言进行图像编辑，如换背景、转风格等。SeedEdit精准理解复杂指令，无需手动涂抹，可连续编辑图像。实测显示，SeedEdit编辑效果精准，简化图像编辑流程，或预示生成式AI修图技术迈向“无PS痕迹”时代。

自动驾驶界秋名山车神！CoRL杰出论文让自驾车学会漂移，机器人整出新活

2024-11-11 22:27

今年的机器人顶会CoRL出现两项杰出论文，一项是让自动驾驶汽车成功完成漂移的研究，另一项则是通过强化学习训练出优秀的导航机器人PoliFormer。其中，自动驾驶汽车漂移研究的一作Kuo-Hao Zeng是华人学者，目前就职于艾伦人工智能研究院。此外，还有四篇论文获得杰出论文提名，涉及机器人策略、人形机器人、视觉语言动作大模型等方面。这些研究推动了机器人学习领域的发展。

改进蛋白突变稳定性预测，清华龚海鹏团队AI蛋白工程模型登Nature子刊

2024-11-11 22:27

清华大学龚海鹏团队开发了一套名为GeoStab-suite的蛋白质突变效应预测模型，包括GeoFitness、GeoDDG和GeoDTm三个模型，能预测蛋白质突变后的适应度、ΔΔG和ΔTm。该模型采用几何学习与预训练策略，显著提高了预测准确率，比现有先进方法性能提升至少30%至70%。相关研究发表于《Nature Computational Science》，模型有望成为蛋白质科学研究的有用工具。

国地共建具身智能机器人创新中心正式发布天工开源计划

2024-11-11 22:27

11月11日，国家地方共建具身智能机器人创新中心举办天工开源计划发布会，展示一年建设成就，开源技术成果推动行业进步。中心旨在构建智能机器人生态，推进关键技术及产品开源等。总经理熊友军强调，将解决技术难题，推陈出新。目前，中心正加速技术突破，开源计划已启动，与多机构合作，推动行业标准制定，旨在加快具身智能机器人的广泛应用。

如何让 AI 影片自带 BGM？CogVideoX+CogSound 技术详解

2024-11-11 22:27

科技记者提炼：清言科技推出国内首个公众视频生成产品“清影”，现迎来重要升级，包括10s 4K 60帧超高清视频生成等。升级基于CogVideoX模型和新技术，如3D VAE结构，增强视频连贯性和质量。同时，新推出的CogSound模型为视频自动生成音效，实现音视频高度一致。公司开源了CogVideoX模型，推动视频生成技术发展。