3
1 2 3 4 5 6
Google 推出 Gemini 3 Flash 高速低延遲 AI 模型全球登場
文章索引: LLM
Google 今天進一步擴展 Gemini 3 模型系列,推出全新的 Gemini 3 Flash。此模型以速度為核心,兼具高效能與低成本,專為需要高頻率工作流程的企業及開發者而設,能在近乎即時的環境下處理資訊、建立自動化工作流及開發具回應性的智能應用。

▪️企業:Gemini 3 Flash 針對追求速度的高頻率工作流程作出完善,卻無須犧牲品質。這讓企業能夠處理近乎即時的資訊,自動化複雜的工作流程,並構建反應迅速的代理程式(agentic applications)。

▪️開發者:Gemini 3 Flash 在邏輯推理、工具應用及多模態處理方面表現卓越。對於需要處理複雜任務如影片分析、數據擷取及視覺問答等的開發者而言,是個理想選擇。這將助開發出更智能、且兼備「快速回應」與「深層推理」能力的應用程式,例如遊戲內置助理或 A/B 測試實驗。
商湯論大模型未來 多模態與具身智能成新藍圖
文章索引: LLM
近年AI發展呈階段性躍升:由生成式 AI(GenAI)帶動內容創作與知識普及,進一步演化為代理式 AI(Agentic AI),能在工作流中自我學習並協作完成複雜任務;同時亦走向具身智能(Embodied AI),讓智能體透過「身體」與物理世界交互,推動在工業、服務及家庭等場景實施。此趨勢顯示 AI 正由虛擬走向現實,從工具轉型為能持續進化的產業基礎設施。

商湯科技董事長兼 CEO 徐立博士指出,過去 10 年是人工智能(AI)認知變化最快的時期,AI 正由感知走向生成,再邁向具身智能與世界模型,重塑各行各業的工作方式。

多模態大模型的突破
R2延遲推出 DeepSeek擬用華為晶片訓練AI失敗
文章索引: LLM
DeepSeek 原定於今年 5 月推出新一代 AI 模型 R2,惟因未能成功以華為 Ascend 晶片完成訓練,導致項目延誤,突顯中國在高階晶片領域仍倚賴美國技術。

據知情人士透露,DeepSeek 在今年初推出 R1 模型後,獲官方鼓勵改用華為晶片取代美國 Nvidia 系統。惟在 R2 模型訓練過程中,Ascend 晶片出現穩定性問題及軟件支援不足,最終公司改以 Nvidia 晶片進行訓練,僅保留華為晶片作推理用途。

AI 模型訓練需大量數據學習,而推理則是模型完成訓練後,用於生成回應或預測的步驟。儘管華為曾派工程團隊駐場支援,DeepSeek 仍未能成功完成訓練。DeepSeek 的困境,反映中國晶片在處理關鍵任務方面仍落後美國,亦揭示北京推動科技自主的挑戰。
AWS 全面支援 OpenAI 開放權重模型 推動 Agentic AI 企業應用邁向 3000 億美元市場
文章索引: LLM
隨著 Agentic AI(AI 代理)應用日益普及,AWS 預期企業對能執行複雜任務的 AI 模型需求將持續上升。據 Gartner 預測,到 2028 年,將有 33% 企業級應用程式整合 Agentic AI,潛在市場規模高達 3000 億美元。

緊接著 OpenAI 推出新開放權重語言模型 gpt-oss-120b 及 gpt-oss-20b,AWS 亦馬上宣佈支援兩款新模型,並透過 Amazon Bedrock 及 Amazon SageMaker AI,讓全球客戶可快速部署生成式 AI 應用。

性價比、透明度與信任兼收並蓄
OpenAI 推新開源語言模型 效能媲美 GPT-4o
文章索引: LLM
OpenAI 於本月 5 日公開推出兩款全新開源語言模型:gpt-oss-120b 及 gpt-oss-20b,並以 Apache 2.0 授權條款公開模型權重。兩款新模型乃 OpenAI 自 GPT-2 以來,首次釋出具代表性的開放權重語言模型,無論在推理能力、工具使用及部署效率方面皆表現卓越。

官方指出,gpt-oss-120b 在核心推理測試中,表現接近 o4-mini,並可於單一 80GB GPU 上高效運行;而 gpt-oss-20b 則僅需 16GB 記憶體,即可在邊緣裝置上運作,適合本地推論及快速迭代。兩者在 TauBench、HealthBench 等評估中表現優異,甚至超越 GPT-4o 及 o1 等專有模型。

模型架構方面,gpt-oss 採用 Transformer 結構及 mixture-of-experts 技術,並支援最長 128k 上下文長度。模型訓練以英文純文字資料為主,涵蓋 STEM、程式編寫及一般知識,並使用升級版分詞器 o200k_harmony。至於安全性方面,OpenAI 為 gpt-oss 模型進行全面安全訓練與對抗性微調測試,並通過外部專家審核,確保模型符合高安全標準。OpenAI 亦舉辦紅隊挑戰賽,鼓勵全球研究人員協助發掘潛在風險。
3
1 2 3 4 5 6