一个AI 产品经理的私人收藏,
让我们共同面对未来,拥抱AIGC时代。

2025-08-14 AI资讯

2025-08-14 AI資訊

崑崙萬維發布多模態深度調研智能體v2

業界首個支持圖文混排分析的AI調研工具,準確率刷新行業紀錄

2025年8月14日,崑崙萬維正式發布Skywork Deep Research Agent v2,這是天工超級智能體(Skywork Super Agents)的核心引擎。該智能體首次將多模態檢索理解和跨模態生成能力完整整合到深度研究工作中,解決了傳統文本分析工具無法處理財報曲線、論文圖表等圖文混排信息的痛點。

通過多模態爬取技術MM-Crawler、長距離多模態信息收集、異步並行Multi-Agent多模態理解架構和多模態結果呈現能力四大技術突破,新版本在權威的搜索評測榜單BrowseComp上表現突出。常規模式下正確率達到27.8%,開啟自主研發的”並行思考”(Parallel Thinking)模式後,正確率更是躍升至38.7%,刷新了行業SOTA紀錄。

崑崙萬維表示,Skywork下一代多智能體系統將深度挖掘不同Agent模型的差異化優勢,構建協同多智能體框架,進一步提升任務處理能力與環境適應性。

查看原文

MongoDB推出Voyage AI新模型

上下文感知功能提升檢索效果,性價比位居業界前列

2025年8月14日,MongoDB在Ai4大會上公布了Voyage AI全新模型,引入上下文感知功能,並刷新準確率基準。新模型能夠捕捉整個文檔的上下文,提供更相關的結果,並降低對數據塊大小的敏感性,可以作為RAG應用程式中標準嵌入的直接替代品。

最新的voyage-3.5和voyage-3.5-lite通用模型提供了業界領先的準確率和性價比。此外,MongoDB還推出了MongoDB MCP伺服器,使AI智能體能夠訪問工具和數據,並擴展其AI合作夥伴生態系統,提升了與業界領先AI框架的互操作性。

目前已有Laurel、Mercor等近8000家初創企業選擇MongoDB助力構建AI項目,每月有超過20萬名新開發者在MongoDB Atlas上註冊。

查看原文

StackOne獲谷歌領投2000萬美元A輪融資

AI集成層解決方案,重塑企業軟體交互方式

2025年8月14日,倫敦創業公司StackOne完成由GV(Google Ventures)領投的2000萬美元A輪融資,OpenAI與DeepMind天使投資人也參與了本輪投資。該公司致力於用AI agent重塑企業軟體集成的底層邏輯,解決不同軟體系統高效協同工作的核心問題。

StackOne的核心創新在於使用專有的AI agent來自動化集成過程,能夠自動學習企業應用的工作流程,理解複雜的API結構,並自動生成能夠通過自然語言指令執行的action。目前已提供超過200個連接器,覆蓋3000多個action,涵蓋從HR到CRM、從工單系統到消息傳遞等各個領域。

與許多競爭對手不同,StackOne採用”不存儲數據”的方法,大大降低了數據洩露的風險,特別適合處理敏感數據的企業。

查看原文

人工智慧基礎設施收購公司申請SPAC方式IPO

融資1億美元,加速AI基礎設施建設

2025年8月14日,人工智慧基礎設施收購公司申請通過特殊目的收購公司(SPAC)方式進行首次公開募股(IPO),計劃融資1億美元。SPAC方式允許公司通過與已上市的空殼公司合併而實現快速上市,繞過傳統IPO的漫長流程。

該公司專注於人工智慧基礎設施領域,此次融資將用於加強其數據中心建設、伺服器集群擴展以及新一代AI晶片採購,以滿足快速增長的AI算力需求。隨著大型語言模型和多模態AI應用的爆發,AI基礎設施成為投資熱點,多家科技巨頭和投資機構都在加大對該領域的布局。

查看原文

NVIDIA發布物理AI新進展,推動機器人仿真技術突破

SIGGRAPH 2025上推出多款軟體庫,提升物理世界理解能力

2025年8月13日,在溫哥華舉行的SIGGRAPH大會上,NVIDIA研究中心發布多款用於物理AI的全新軟體庫,包括用於大規模場景重建的NVIDIA Omniverse NuRec 3D Gaussian Splatting庫、用於視覺AI的NVIDIA Metropolis平臺的更新,以及NVIDIA Cosmos和NVIDIA Nemotron推理模型。

其中,Cosmos Reason是一款面向物理AI的全新推理視覺語言模型,可使機器人和視覺AI智能體利用先驗知識、物理規律理解和常識實現類似人類的推理能力。這些技術突破將為下一代物理AI工具提供支持,特別是在機器人開發和自動駕駛汽車訓練方面具有重要應用潛力。

NVIDIA研究副總裁Ming-Yu Liu表示:”物理AI需要一個觸感真實的虛擬環境,一個讓機器人能通過試錯安全學習的並行宇宙。”

查看原文

騰訊發布混元Large-Vision多模態模型

52B參數支持圖像視頻3D輸入,工業質檢領域展現潛力

2025年8月14日,騰訊發布國內首個商業級多模態理解模型混元Large-Vision,採用MoE架構激活52B參數,在LMArena Vision榜單以1256分位列全球第五(國內第一)。該模型支持任意解析度圖像、視頻和3D空間輸入,在工業質檢、自動駕駛場景理解等領域展現出巨大潛力。

混元Large-Vision的多語言理解準確率達79.5%,視覺推理任務處理尺寸達3775×2400,為跨文化內容生成和複雜場景分析提供了技術基礎。騰訊表示,該模型將加速AI在製造業、醫療健康和智能交通等關鍵行業的落地應用。

查看原文

赞(0) 打赏
未经允许不得转载:AIPMClub » 2025-08-14 AI资讯

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

Verified by MonsterInsights