3403 字
19 分鐘
請注意,本文最後修改於 0 天前。
📰 科技風向標 · 2026-06-30
Cover image for 📰 科技風向標 · 2026-06-30

#🧠 模型發佈/更新

#1. 美團LongCat Owl Alpha:OpenRouter最流行模型,1.6萬億MoE,國產ASIC訓練

美團LongCat的1.6萬億參數MoE模型Owl Alpha成為OpenRouter上最流行模型,累計消耗10萬億tokens,性能達Gemini/Opus 4.6級別。該模型使用35萬億tokens訓練,完全在5萬塊國產ASIC上完成。據官方推文,Owl Alpha上線後每日調用量全球Top3,在Hermes Agent排名#1,Claude Code排名#2,OpenClaw排名#3。該模型即將退役,後續版本待公佈。

TIP

來源:X:Emad Mostaque (@EMostaque)


#🚀 產品發佈/更新

#2. 從任何地點構建——Cursor for iOS 公測版發佈

Cursor 推出 iOS 原生公測版,所有付費計劃可用。開發者可在手機上啟動始終在線的雲端智能體,或遠程操控電腦端智能體。支持語音輸入、斜槓命令和選擇前沿模型。智能體運行後,鎖屏 Live Activities 和推送通知實時更新狀態,完成或需要輸入時提醒。雲端智能體在隔離虛擬機中運行,可自動迭代生成合並就緒的 PR,並輸出演示、截圖和日誌。本地與雲端智能體支持雙向切換。移動端 Composer 2.5 享受 75% 折扣,優惠至 2026 年 7 月 5 日。

TIP

來源:Cursor Blog

#3. EverOS:開源Markdown優先智能體記憶運行時,支持混合檢索與自進化技能

EverMind 推出開源智能體記憶運行時 EverOS(Apache 2.0 許可)。它以可編輯的 Markdown 文件為記憶主體,經 SQLite 管理狀態、LanceDB 實現混合檢索(BM25 關鍵詞 + 向量搜索 + 標量過濾)。每個完成的任務記錄為 Case,離線提煉為可複用的 Skill,使記憶隨使用自我進化。v1.1.0 新增 Knowledge APIs(支持分類與話題搜索的 Markdown 頁面)和 Reflection(跨會話優化 Profile 和 Skill)。據 EverMind 報告,LoCoMo 得分 93.05%,LongMemEval 83.00%,HaluMem 93.04%,p95 檢索延…

TIP

來源:MarkTechPost(RSS)

#4. 小紅書 RedKnot 推理引擎:將 KV Cache 按注意力頭拆解實現長文本加速

RedKnot 將 KV Cache 沿注意力頭維度拆解,通過頭分類稀疏(局部頭佔 83.4%–96.8%)、稀疏 FFN 和 SegPagedAttention 三個機制統一算法與存儲粒度。在 8 卡 H800 上,TTFT 最高加速 1.6–3.54×,單卡併發提升 4.7–7.8×,預填充 FLOPs 削減 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速達 5.16×,KV 傳輸最多省 6.3×。精度通常不低於稠密 F1 的 95%。

TIP

來源:公眾號:小紅書技術(dots.llm)

#5. OpenClaw 發佈原生 iOS 與 Android 應用

OpenClaw 現已登陸 iOS 和 Android 🦞 📱 原生移動應用,終於來了 💬 智能體裝進口袋 🔔 頻道、任務、回覆,隨時處理 用你的大拇指,在任何地方運行智能體。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app

TIP

來源:X:OpenClaw (@openclaw)

#6. Herdr:駐留在終端中的AI智能體多路複用器

Herdr是一個駐留在終端中的AI智能體多路複用器,允許用戶在單一終端界面內管理和切換多個AI智能體會話。

TIP

來源:Hacker News 熱門(buzzing.cc 中文翻譯)

#7. 為 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway,一個自託管控制平面,讓企業能在 Amazon Bedrock 和 Google Cloud 上運行 Claude Code。它作為單個無狀態容器部署於 Linux,後端使用 PostgreSQL,提供企業級 SSO 登錄(通過 OIDC 對接 Google Workspace、Microsoft Entra ID、Okta 等)、集中策略管理、角色權限、路由(支持故障轉移)以及按日/周/月、按組織/群組/用戶的消費上限。遙測數據通過 OTLP 發送至用戶配置的收集器。gateway 不會向 Anthropic 發送推理流量或使用數據(除非配置使用 Claude A…

TIP

來源:Claude:Blog(網頁)

#8. Claude 在 Microsoft Foundry 正式可用

從今天起,Claude 模型在 Microsoft Foundry 上正式可用,託管於 Azure 環境,運行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5,通過 Messages API 調用,支持提示緩存和擴展思考。用戶可選擇推理處理位置,包括美國數據區域,由 Anthropic 負責推理運營。Azure 用戶可使用現有身份驗證、計費與治理控制,並獲得統一賬單;符合條件的 Enterprise Agreement 客戶可將 Claude 用量計入 Azure 承諾消費。

TIP

來源:Claude:Blog(網頁)

#9. Claude Code v2.1.196 發佈

新增組織默認模型支持,未選模型時顯示“Org default”。聊天會話可讀默認名稱,文件附件支持 Cmd/Ctrl-click 定位。安全方面,claude mcp list/get 不再啟動通過 .claude/settings.json 自批准的不安全服務器;不受信任工作區顯示“Pending approval”。/code-review 合併五個清理查找器,token 用量減少約 25%。終端 UI 跳過空子樹遍歷減少渲染。流式空閒看門狗默認開啟,5 分鐘無事件自動中止重試。修復背景對話誤刪、遠程會話自動恢復、MCP OAuth 作用域衝突、Agents 側邊欄焦點丟失等多項問題。

TIP

來源:Claude Code:GitHub Releases(RSS)


#🏛️ 行業動態

#10. 國務院印發《教育發展“十五五”規劃》,推進人工智能全學段教育

國務院日前印發《教育發展“十五五”規劃》,要求推進人工智能全學段教育,提升學生人工智能素養及提出問題、解決問題的能力。規劃明確完善科學教育體系,強化科技教育與人文教育協同,加強青少年科學素養、批判性思維和創新能力培養。同時實施學生體質強健計劃、心理健康促進行動,加大拔尖創新人才自主培養力度,推動學科交叉融合,擴大優質本科招生規模。目標到2030年高質量教育體系基本建成。

TIP

來源:IT之家(RSS)

#11. Rubin Ultra取消,新版尺寸性能減半

有意思:在GTC 2026宣佈Rubin Ultra僅3個月後,原4-die Rubin Ultra因製造執行問題被取消。新的“Rubin Ultra”尺寸減半,實際性能約為原版的一半。1/4🧵

TIP

來源:X:SemiAnalysis (@SemiAnalysis_)

#12. 美軍用AI選目標卻誤炸伊朗學校,Anthropic Claude嵌入Palantir系統首日建議約1000目標

美軍在打擊伊朗時首次大規模使用AI選擇目標(Anthropic的Claude模型嵌入Palantir的Maven Smart System,首日建議約1000個目標),但對一所學校的導彈襲擊導致約120名兒童死亡。調查發現,情報分析師早在2019年就通過數字工具標記該地點已變為小學,但該工具未連接軍方官方目標數據庫MIDB,信息從未送達指揮官。MIDB建於1980年代,依賴手動輸入,替代系統MARS多年延遲。五角大樓事後宣佈推出agentic AI initiative。Project Maven創建人Jack Shanahan批評目標驗證不力不可原諒。

TIP

來源:The Decoder:AI News(RSS)

#13. 三星和SK海力士計劃投資5900億美元擴產芯片,AI需求推高內存價格

在韓國政府支持下,三星和SK海力士計劃投入5900億美元擴大芯片產能,包括800萬億韓元新建四座工廠、81萬億韓元建封裝中心,以及未來15年30萬億韓元用於研發下一代芯片。AI數據中心需求是主要驅動力。Jefferies預測,2026年Q3內存價格將上漲40%至50%,Q4再漲30%至40%,2027年繼續上漲40%至45%,到2028年新產能僅上線15%至20%才可能緩解。兩家公司合計控制全球近80%的高帶寬內存芯片市場。內存漲價已推高消費電子產品成本,蘋果已上調Mac和MacBook售價。

TIP

來源:The Decoder:AI News(RSS)

#14. SK 集團會長崔泰源:到 2035 年建設 15GW AI 數據中心,總投資達 1000 萬億韓元

SK 集團會長崔泰源 6 月 29 日宣佈,計劃到 2035 年建成 15GW AI 數據中心容量,作為韓國國家級基礎設施和實體 AI 時代核心底座。項目總投資 1000 萬億韓元(約 4.4 萬億元人民幣),未來 10 年保持年均 100 萬億韓元以上國內投資,旨在實現從出口傳統商品向智能服務的轉變,構建韓國智能市場。此外,SK 海力士將向韓國西南部投資 400 萬億韓元,半導體供應項目總投資達 1100 萬億韓元(約 4.84 萬億元人民幣)。

TIP

來源:IT之家(RSS)


#📄 論文研究

#15. Meta發佈Brain2Qwerty v2:非侵入式實時句子解碼

Meta公佈Brain2Qwerty v2,這是非侵入式腦電信號解碼研究的最新里程碑。基於當天發表在《Nature》的v1,v2是性能最高的端到端管道,能從原始腦信號實時解碼句子。其從字符級性能提升至解碼單詞和語義,提高整體溝通準確性。該研究有望幫助數百萬因腦損傷或疾病無法溝通的人群。

TIP

來源:X:AI at Meta (@AIatMeta)

#16. Claude Code 打開 GitHub 倉庫即執行隱藏惡意代碼,攻擊者可獲完全控制

安全研究人員在 Mozilla 的 GenAI 漏洞賞金平臺 0DIN 發現新攻擊向量。一個看似正常的 GitHub 倉庫包含 setup 腳本,該腳本運行時從 DNS 條目拉取命令並執行,惡意代碼從未存在於倉庫中,對掃描器、代碼審查和 AI 智能體不可見。開發者使用 Claude Code 等 AI 編碼工具打開該倉庫時,Claude Code 在設置過程中遇到常規錯誤消息後自動運行該腳本,打開反向 shell,攻擊者可竊取 API 密鑰和登錄憑據並維持持久訪問。研究人員建議 AI 智能體應在運行前顯示 setup 腳本內容,開發者應將第三方倉庫的 setup 說明視為不受信任代碼。

TIP

來源:The Decoder:AI News(RSS)

#17. OpenAI 報告:繪製歐洲 AI 勞動力機遇版圖

OpenAI 發佈新報告,分析 AI 對歐盟就業的影響,劃定哪些職業面臨自動化、增長或工作流程變化。

TIP

來源:OpenAI:官網動態(RSS · 排除企業/客戶案例)

#18. DiScoFormer:一個跨分佈同時估計密度與分數的單一Transformer模型

DiScoFormer(Density and Score Transformer)是一個無需重新訓練即可從數據點估計分佈密度和分數的單一模型。它利用Transformer的交叉注意力機制,在單次前向傳播中輸出密度和分數,並通過一致性損失實現分佈外自適應。在100維空間中,DiScoFormer比最優調參的核密度估計(KDE)降低分數誤差約6.5倍、密度誤差超過37倍,且隨樣本量增加持續提升,而KDE內存耗盡。模型基於高斯混合模型訓練,可泛化至非高斯分佈(如Laplace、Student-t)及未見過的多模態混合。

TIP

來源:Hugging Face:Blog(RSS)


#💡 技巧與觀點

#19. Anthropic工程師Margot Van Laar:提示詞工程實戰——調試生產提示詞為主,評估是唯一嚴謹方式

An anthropic應用AI工程師Margot Van Laar在Code with Claude分享提示詞工程實戰,核心觀點:大部分時間在調試和維護已有生產提示詞而非從零編寫。兩個場景:客服機器人維護中,用XML標籤結構化清理,移除舊模型遺留的“禁止列表”指令(新模型會過度擬合),精確計算應調用工具,轉人工決策需明確代價與收益;零售排班Agent從零構建時,拆成生成-評估-修復三個簡單提示詞更穩定,選用更強推理模型(Opus)。她反覆強調:評估(Eval)是唯一嚴謹方式,沒有評估就是碰運氣。

TIP

來源:X:Berry Xia (@berryxia)

#20. Qwen 3.6 27B 是本地開發的理想選擇

Qwen 3.6 27B 是一款密集參數本地大語言模型,原生支持 256k 上下文。在 Macbook Max M5 上運行 llama.cpp Q8_0 量化版(含多 token 預測)可達 30 tokens/s;用戶反饋在 RTX 5090 上 Q6_K 量化可達 50 tokens/s。它可通過單個提示完成創意詩歌、用 pnpm 生成六邊形掃雷遊戲等任務,作者稱其為首個真正具備通用智能的本地模型。另有一個 MoE 變體 35B A3B,但作者推薦 27B 版本。

TIP

來源:Hacker News 熱門(buzzing.cc 中文翻譯)

#21. 分享兩個Vibe Coding必備的實用Prompt:第一性原理與對抗式審查

作者分享Vibe Coding中兩個關鍵Prompt:一是“從第一性原理出發”,強制AI跳出類比推理,從基本事實重新推導本質,曾幫作者發現AIHOT抓取海外信源的底層流量路由隱患並徹底重構;二是“對抗式審查”,讓AI站在惡意用戶角度攻防式審查代碼,檢出OOM死循環、未來時間汙染等手工難發現的BUG。兩個Prompt形成生成與驗證閉環,使純Vibe Coding項目AIHOT最近一週請求量超千萬次。

TIP

來源:公眾號:數字生命卡茲克

#22. Anthropic:當AI成本超過工程師薪酬

Anthropic在算力上的支出達到每位工程師每年51.5萬美元,是其完全薪資(22.4萬美元)的2.3倍。相比之下,頂尖1%軟件公司的算力支出為8.9萬美元,中位數僅為1.37萬美元。三個2029年情景預測了這一差距的縮小路徑。

TIP

來源:Tomer Tunguz 博客(VC 分析)

📰 科技風向標 · 2026-06-30
https://illumi.love/posts/日報向/2026-06-30/
作者
𝑰𝒍𝒍𝒖𝒎𝒊糖糖
發布於
2026-06-30
許可協議
🔒CC BY-NC-ND 4.0
分享

如果這篇文章對你有幫助,歡迎分享給更多人!

💬 參與討論
使用 GitHub 帳號登入參與討論