📰 科技風向標 · 2026-06-30

#🧠 模型發佈/更新

#1. 美團LongCat Owl Alpha：OpenRouter最流行模型，1.6萬億MoE，國產ASIC訓練

美團LongCat的1.6萬億參數MoE模型Owl Alpha成為OpenRouter上最流行模型，累計消耗10萬億tokens，性能達Gemini/Opus 4.6級別。該模型使用35萬億tokens訓練，完全在5萬塊國產ASIC上完成。據官方推文，Owl Alpha上線後每日調用量全球Top3，在Hermes Agent排名#1，Claude Code排名#2，OpenClaw排名#3。該模型即將退役，後續版本待公佈。

TIP
來源：X：Emad Mostaque (@EMostaque)

#🚀 產品發佈/更新

#2. 從任何地點構建——Cursor for iOS 公測版發佈

Cursor 推出 iOS 原生公測版，所有付費計劃可用。開發者可在手機上啟動始終在線的雲端智能體，或遠程操控電腦端智能體。支持語音輸入、斜槓命令和選擇前沿模型。智能體運行後，鎖屏 Live Activities 和推送通知實時更新狀態，完成或需要輸入時提醒。雲端智能體在隔離虛擬機中運行，可自動迭代生成合並就緒的 PR，並輸出演示、截圖和日誌。本地與雲端智能體支持雙向切換。移動端 Composer 2.5 享受 75% 折扣，優惠至 2026 年 7 月 5 日。

TIP
來源：Cursor Blog

#3. EverOS：開源Markdown優先智能體記憶運行時，支持混合檢索與自進化技能

EverMind 推出開源智能體記憶運行時 EverOS（Apache 2.0 許可）。它以可編輯的 Markdown 文件為記憶主體，經 SQLite 管理狀態、LanceDB 實現混合檢索（BM25 關鍵詞 + 向量搜索 + 標量過濾）。每個完成的任務記錄為 Case，離線提煉為可複用的 Skill，使記憶隨使用自我進化。v1.1.0 新增 Knowledge APIs（支持分類與話題搜索的 Markdown 頁面）和 Reflection（跨會話優化 Profile 和 Skill）。據 EverMind 報告，LoCoMo 得分 93.05%，LongMemEval 83.00%，HaluMem 93.04%，p95 檢索延…

TIP
來源：MarkTechPost（RSS）

#4. 小紅書 RedKnot 推理引擎：將 KV Cache 按注意力頭拆解實現長文本加速

RedKnot 將 KV Cache 沿注意力頭維度拆解，通過頭分類稀疏（局部頭佔 83.4%–96.8%）、稀疏 FFN 和 SegPagedAttention 三個機制統一算法與存儲粒度。在 8 卡 H800 上，TTFT 最高加速 1.6–3.54×，單卡併發提升 4.7–7.8×，預填充 FLOPs 削減 67%–79.5%。DeepSeek-V4-Flash 上 128K 上下文 TTFT 加速達 5.16×，KV 傳輸最多省 6.3×。精度通常不低於稠密 F1 的 95%。

TIP
來源：公眾號：小紅書技術（dots.llm）

#5. OpenClaw 發佈原生 iOS 與 Android 應用

OpenClaw 現已登陸 iOS 和 Android 🦞 📱 原生移動應用，終於來了 💬 智能體裝進口袋 🔔 頻道、任務、回覆，隨時處理用你的大拇指，在任何地方運行智能體。 iOS: https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132 Android: https://play.google.com/store/apps/details?id=ai.openclaw.app

TIP
來源：X：OpenClaw (@openclaw)

#6. Herdr：駐留在終端中的AI智能體多路複用器

Herdr是一個駐留在終端中的AI智能體多路複用器，允許用戶在單一終端界面內管理和切換多個AI智能體會話。

TIP
來源：Hacker News 熱門（buzzing.cc 中文翻譯）

#7. 為 Amazon Bedrock 和 Google Cloud 推出的 Claude apps gateway

Anthropic 今日推出 Claude apps gateway，一個自託管控制平面，讓企業能在 Amazon Bedrock 和 Google Cloud 上運行 Claude Code。它作為單個無狀態容器部署於 Linux，後端使用 PostgreSQL，提供企業級 SSO 登錄（通過 OIDC 對接 Google Workspace、Microsoft Entra ID、Okta 等）、集中策略管理、角色權限、路由（支持故障轉移）以及按日/周/月、按組織/群組/用戶的消費上限。遙測數據通過 OTLP 發送至用戶配置的收集器。gateway 不會向 Anthropic 發送推理流量或使用數據（除非配置使用 Claude A…

TIP
來源：Claude：Blog（網頁）

#8. Claude 在 Microsoft Foundry 正式可用

從今天起，Claude 模型在 Microsoft Foundry 上正式可用，託管於 Azure 環境，運行在 NVIDIA GB300 GPU 上。首批提供 Claude Opus 4.8 和 Claude Haiku 4.5，通過 Messages API 調用，支持提示緩存和擴展思考。用戶可選擇推理處理位置，包括美國數據區域，由 Anthropic 負責推理運營。Azure 用戶可使用現有身份驗證、計費與治理控制，並獲得統一賬單；符合條件的 Enterprise Agreement 客戶可將 Claude 用量計入 Azure 承諾消費。

TIP
來源：Claude：Blog（網頁）

#9. Claude Code v2.1.196 發佈

新增組織默認模型支持，未選模型時顯示“Org default”。聊天會話可讀默認名稱，文件附件支持 Cmd/Ctrl-click 定位。安全方面，claude mcp list/get 不再啟動通過 .claude/settings.json 自批准的不安全服務器；不受信任工作區顯示“Pending approval”。/code-review 合併五個清理查找器，token 用量減少約 25%。終端 UI 跳過空子樹遍歷減少渲染。流式空閒看門狗默認開啟，5 分鐘無事件自動中止重試。修復背景對話誤刪、遠程會話自動恢復、MCP OAuth 作用域衝突、Agents 側邊欄焦點丟失等多項問題。

TIP
來源：Claude Code：GitHub Releases（RSS）

#🏛️ 行業動態

#10. 國務院印發《教育發展“十五五”規劃》，推進人工智能全學段教育

國務院日前印發《教育發展“十五五”規劃》，要求推進人工智能全學段教育，提升學生人工智能素養及提出問題、解決問題的能力。規劃明確完善科學教育體系，強化科技教育與人文教育協同，加強青少年科學素養、批判性思維和創新能力培養。同時實施學生體質強健計劃、心理健康促進行動，加大拔尖創新人才自主培養力度，推動學科交叉融合，擴大優質本科招生規模。目標到2030年高質量教育體系基本建成。

TIP
來源：IT之家（RSS）

#11. Rubin Ultra取消，新版尺寸性能減半

有意思：在GTC 2026宣佈Rubin Ultra僅3個月後，原4-die Rubin Ultra因製造執行問題被取消。新的“Rubin Ultra”尺寸減半，實際性能約為原版的一半。1/4🧵

TIP
來源：X：SemiAnalysis (@SemiAnalysis_)

#12. 美軍用AI選目標卻誤炸伊朗學校，Anthropic Claude嵌入Palantir系統首日建議約1000目標

美軍在打擊伊朗時首次大規模使用AI選擇目標（Anthropic的Claude模型嵌入Palantir的Maven Smart System，首日建議約1000個目標），但對一所學校的導彈襲擊導致約120名兒童死亡。調查發現，情報分析師早在2019年就通過數字工具標記該地點已變為小學，但該工具未連接軍方官方目標數據庫MIDB，信息從未送達指揮官。MIDB建於1980年代，依賴手動輸入，替代系統MARS多年延遲。五角大樓事後宣佈推出agentic AI initiative。Project Maven創建人Jack Shanahan批評目標驗證不力不可原諒。

TIP
來源：The Decoder：AI News（RSS）

#13. 三星和SK海力士計劃投資5900億美元擴產芯片，AI需求推高內存價格

在韓國政府支持下，三星和SK海力士計劃投入5900億美元擴大芯片產能，包括800萬億韓元新建四座工廠、81萬億韓元建封裝中心，以及未來15年30萬億韓元用於研發下一代芯片。AI數據中心需求是主要驅動力。Jefferies預測，2026年Q3內存價格將上漲40%至50%，Q4再漲30%至40%，2027年繼續上漲40%至45%，到2028年新產能僅上線15%至20%才可能緩解。兩家公司合計控制全球近80%的高帶寬內存芯片市場。內存漲價已推高消費電子產品成本，蘋果已上調Mac和MacBook售價。

TIP
來源：The Decoder：AI News（RSS）

#14. SK 集團會長崔泰源：到 2035 年建設 15GW AI 數據中心，總投資達 1000 萬億韓元

SK 集團會長崔泰源 6 月 29 日宣佈，計劃到 2035 年建成 15GW AI 數據中心容量，作為韓國國家級基礎設施和實體 AI 時代核心底座。項目總投資 1000 萬億韓元（約 4.4 萬億元人民幣），未來 10 年保持年均 100 萬億韓元以上國內投資，旨在實現從出口傳統商品向智能服務的轉變，構建韓國智能市場。此外，SK 海力士將向韓國西南部投資 400 萬億韓元，半導體供應項目總投資達 1100 萬億韓元（約 4.84 萬億元人民幣）。

TIP
來源：IT之家（RSS）

#📄 論文研究

#15. Meta發佈Brain2Qwerty v2：非侵入式實時句子解碼

Meta公佈Brain2Qwerty v2，這是非侵入式腦電信號解碼研究的最新里程碑。基於當天發表在《Nature》的v1，v2是性能最高的端到端管道，能從原始腦信號實時解碼句子。其從字符級性能提升至解碼單詞和語義，提高整體溝通準確性。該研究有望幫助數百萬因腦損傷或疾病無法溝通的人群。

TIP
來源：X：AI at Meta (@AIatMeta)

#16. Claude Code 打開 GitHub 倉庫即執行隱藏惡意代碼，攻擊者可獲完全控制

安全研究人員在 Mozilla 的 GenAI 漏洞賞金平臺 0DIN 發現新攻擊向量。一個看似正常的 GitHub 倉庫包含 setup 腳本，該腳本運行時從 DNS 條目拉取命令並執行，惡意代碼從未存在於倉庫中，對掃描器、代碼審查和 AI 智能體不可見。開發者使用 Claude Code 等 AI 編碼工具打開該倉庫時，Claude Code 在設置過程中遇到常規錯誤消息後自動運行該腳本，打開反向 shell，攻擊者可竊取 API 密鑰和登錄憑據並維持持久訪問。研究人員建議 AI 智能體應在運行前顯示 setup 腳本內容，開發者應將第三方倉庫的 setup 說明視為不受信任代碼。

TIP
來源：The Decoder：AI News（RSS）

#17. OpenAI 報告：繪製歐洲 AI 勞動力機遇版圖

OpenAI 發佈新報告，分析 AI 對歐盟就業的影響，劃定哪些職業面臨自動化、增長或工作流程變化。

TIP
來源：OpenAI：官網動態（RSS · 排除企業/客戶案例）

#18. DiScoFormer：一個跨分佈同時估計密度與分數的單一Transformer模型

DiScoFormer（Density and Score Transformer）是一個無需重新訓練即可從數據點估計分佈密度和分數的單一模型。它利用Transformer的交叉注意力機制，在單次前向傳播中輸出密度和分數，並通過一致性損失實現分佈外自適應。在100維空間中，DiScoFormer比最優調參的核密度估計（KDE）降低分數誤差約6.5倍、密度誤差超過37倍，且隨樣本量增加持續提升，而KDE內存耗盡。模型基於高斯混合模型訓練，可泛化至非高斯分佈（如Laplace、Student-t）及未見過的多模態混合。

TIP
來源：Hugging Face：Blog（RSS）

#💡 技巧與觀點

#19. Anthropic工程師Margot Van Laar：提示詞工程實戰——調試生產提示詞為主，評估是唯一嚴謹方式

An anthropic應用AI工程師Margot Van Laar在Code with Claude分享提示詞工程實戰，核心觀點：大部分時間在調試和維護已有生產提示詞而非從零編寫。兩個場景：客服機器人維護中，用XML標籤結構化清理，移除舊模型遺留的“禁止列表”指令（新模型會過度擬合），精確計算應調用工具，轉人工決策需明確代價與收益；零售排班Agent從零構建時，拆成生成-評估-修復三個簡單提示詞更穩定，選用更強推理模型（Opus）。她反覆強調：評估（Eval）是唯一嚴謹方式，沒有評估就是碰運氣。

TIP
來源：X：Berry Xia (@berryxia)

#20. Qwen 3.6 27B 是本地開發的理想選擇

Qwen 3.6 27B 是一款密集參數本地大語言模型，原生支持 256k 上下文。在 Macbook Max M5 上運行 llama.cpp Q8_0 量化版（含多 token 預測）可達 30 tokens/s；用戶反饋在 RTX 5090 上 Q6_K 量化可達 50 tokens/s。它可通過單個提示完成創意詩歌、用 pnpm 生成六邊形掃雷遊戲等任務，作者稱其為首個真正具備通用智能的本地模型。另有一個 MoE 變體 35B A3B，但作者推薦 27B 版本。

TIP
來源：Hacker News 熱門（buzzing.cc 中文翻譯）

#21. 分享兩個Vibe Coding必備的實用Prompt：第一性原理與對抗式審查

作者分享Vibe Coding中兩個關鍵Prompt：一是“從第一性原理出發”，強制AI跳出類比推理，從基本事實重新推導本質，曾幫作者發現AIHOT抓取海外信源的底層流量路由隱患並徹底重構；二是“對抗式審查”，讓AI站在惡意用戶角度攻防式審查代碼，檢出OOM死循環、未來時間汙染等手工難發現的BUG。兩個Prompt形成生成與驗證閉環，使純Vibe Coding項目AIHOT最近一週請求量超千萬次。

TIP
來源：公眾號：數字生命卡茲克

#22. Anthropic：當AI成本超過工程師薪酬

Anthropic在算力上的支出達到每位工程師每年51.5萬美元，是其完全薪資（22.4萬美元）的2.3倍。相比之下，頂尖1%軟件公司的算力支出為8.9萬美元，中位數僅為1.37萬美元。三個2029年情景預測了這一差距的縮小路徑。

TIP
來源：Tomer Tunguz 博客（VC 分析）