2621 字
15 分鐘
請注意,本文最後修改於 0 天前。
📰 科技風向標 · 2026-07-04
Cover image for 📰 科技風向標 · 2026-07-04

#🧠 模型發佈/更新

#1. 生數科技發佈 Vidu S1,推動視頻生成邁向“實時交互”新時代

7月3日,生數科技在2026全球數字經濟大會上發佈Vidu S1實時交互模型,支持實時視頻通話和語音控制視頻走向,實現無限時長連續互動。模型採用自迴歸擴散路線,基於已生成畫面和語音指令持續預測後續內容;無需傳統建模,一張圖片即可創建角色並自定義音色。Vidu S1在540P分辨率下實現25FPS(最高42FPS)實時生成,通過TurboDiffusion等技術降低計算成本,已開啟內測。

TIP

來源:公眾號:生數科技(Vidu·視頻)


#🚀 產品發佈/更新

#1. Wan Video 推出“音樂伴舞”新功能

Wan Video 新功能:音樂伴舞 💃 上傳一個角色,添加一首歌曲,讓 Wan Video 生成與節奏同步的舞蹈視頻。 可用舞種: • 街舞 • 踢踏舞 • 拉丁舞 • K-Pop • 中國古典舞 從節拍至動作,你的角色隨音樂起舞。 前往 wan.video 體驗音樂伴舞 👉 https://int.alibabacloud.com/m/1000412428/

TIP

來源:X:阿里雲 / Alibaba Cloud (@alibaba_cloud)

#2. 面向 Web 開發者的 Safari MCP 服務器

Safari Technology Preview 247 推出 Safari MCP 服務器,基於 Model Context Protocol,允許任何 MCP 兼容客戶端連接 Safari 瀏覽器窗口。智能體可獲取 DOM、網絡請求、截圖、控制檯輸出等信息,自主完成調試、性能分析、可訪問性檢查等任務。內置 browser_console_messagesscreenshotevaluate_javascriptlist_network_requests 等工具。開發者安裝後啟用“遠程自動化與外部智能體”選項,即可通過命令接入,減少窗口切換。

TIP

來源:Hacker News 熱門(buzzing.cc 中文翻譯)

#3. JoyAI App 上線 UGC 數字人功能,用戶可“捏”出專屬虛擬玩伴

JoyAI App 近日上線 UGC 數字人功能,用戶只需上傳一張照片即可生成專屬虛擬數字分身,支持一鍵復刻寫實形象或通過模板重塑為卡通風格,搭配用戶自己的語音即可解鎖專屬陪伴。該功能複用“萬能博士”技術底座,集成 JoyAI 語言、語音、數字人大模型,實現行業領先的全雙工對話,支持隨時打斷、自然接話。數字人兼具情緒陪伴與全能助手屬性,可提供點外賣、金融諮詢、學英語、規劃行程等生活服務。

TIP

來源:公眾號:京東JoyAI

#4. 面壁智能發佈AI全自動預訓練框架ForgeTrain,8小時追平Megatron-LM

面壁智能發佈全球首個完全由AI編寫、無人類干預的生產級大模型預訓練框架ForgeTrain。該框架針對特定模型和硬件從零自動“鍛造”專用訓練代碼。基準測試顯示,ForgeTrain在8小時內追平Megatron-LM,1.5至2天內實現穩定反超,模型FLOPS利用率提升約8%~10%,且可遷移至不同模型(MiniCPM4-0.5B/8B)和硬件(H100及昇騰NPU)。其採用四階段Harness優化流程,全程自動判定。面壁智能將其工程思想概括為Forge Engineering。

TIP

來源:公眾號:面壁智能(MiniCPM)

#5. Claude Code v2.1.200 發佈

Claude Code v2.1.200 將 AskUserQuestion 對話框默認改為不自動繼續,可通過 /config 設置空閒超時;默認權限模式改為“Manual”。修復了啟動時因 .claude.json 中 disabledMcpServers 或 enabledMcpServers 為非數組值導致的崩潰、後臺會話在休眠/喚醒或重新打開卡頓會話時無聲停止、後臺代理因陳舊 daemon.lock 無法重啟、子代理因速率限制截斷後未返回空結果等問題。改進了屏幕閱讀器輸出,隱藏裝飾性字符,並優化轉錄符號與嵌套表格朗讀。安裝腳本在因系統內存不足被終止時會給出說明。

TIP

來源:Claude Code:GitHub Releases(RSS)


#🏛️ 行業動態

#1. 國家網信辦就《互聯網信息服務管理辦法》再次徵求意見,首設“智能信息服務”專章規範AI服務

7月3日,國家互聯網信息辦公室就《互聯網信息服務管理辦法(修訂草案徵求意見稿)》再次公開徵求意見。草案新增“智能信息服務”專章,要求AI服務提供者公示技術基本原理、訓練數據來源,對生成合成內容進行標識,禁止強制用戶使用智能服務或利用算法擾亂網絡輿論。草案還強化用戶賬號管理,明確對超過6個月不登錄賬號可依約註銷;要求平臺建立網絡暴力信息特徵庫,提供屏蔽、禁止轉載等防護選項。意見反饋截止8月2日。

TIP

來源:IT之家(RSS)

#2. 全球首例 AI Agent 勒索攻擊曝光,從漏洞利用到數據庫加密全程自主完成

安全廠商 Sysdig 首次記錄到 AI Agent“JADEPUFFER”自動完成的勒索攻擊。攻擊利用暴露的 Langflow 服務漏洞 CVE-2025-3248 遠程執行 Python 代碼,隨後自主收集 OpenAI、Anthropic、DeepSeek、Gemini 等 API 密鑰及阿里雲、騰訊雲、華為雲、AWS、Google Cloud、Azure 等雲平臺憑證,通過 MinIO 默認密碼訪問對象存儲並創建每 30 分鐘連接的計劃任務。橫向移動到 MySQL 和 Nacos 服務器,利用數據庫 Root 賬號及 Nacos 漏洞 CVE-2021-29441 獲取管理權限,加密全部 1342 條配置數據,留下包含比特幣…

TIP

來源:IT之家(RSS)

#3. Google DeepMind 與 A24 宣佈首次研究合作伙伴關係

Google DeepMind 與電影製作工作室 A24 達成一項首次研究合作,旨在幫助藝術家開發新工作流程和技術。合作將 DeepMind 的 AI 創新直接嵌入創作過程,由 A24 及其電影人塑造新技術以服務其願景並擴展敘事可能性,同時為 DeepMind 提供來自頂尖藝術家的反饋與指導。此外,Google 已對 A24 進行投資。雙方研究人員將共同測試、迭代和構建,以拓展未來娛樂的可能性。

TIP

來源:Google DeepMind:Blog(RSS)


#📄 論文研究

#1. 阿里達摩院發佈超導材料發現AI智能體Elements Claw

7月3日,阿里達摩院聯合中國人民大學、中國科學院大學發佈首個超導材料發現AI智能體Elements Claw。該智能體採用“專通融合”架構,基於1.25億分子/晶體結構預訓練的1B參數原子基礎模型Elements,判斷超導性AUC達0.996,預測臨界溫度平均誤差小於1K。AI僅用28個GPU小時篩選240萬晶體結構,預測出6.8萬個候選材料,其中4種(Hf₂₁Re₂₅、Zr₄VRe₇、HfZrRe₄、Zr₃ScRe₈)已合成並驗證超導性,臨界溫度最高6.5K。全部240萬穩定晶體數據庫已開放。

TIP

來源:IT之家(RSS)


#💡 技巧與觀點

#1. pxpipe:通過圖像化壓縮輸入token降低Claude Code成本

pxpipe是一個本地代理,將系統提示、工具文檔和歷史記錄等密集文本渲染為PNG圖像,利用圖像token成本取決於像素尺寸的特性壓縮輸入token。在Fable 5模型上,約25k文本token壓縮為約2.7k圖像token,端到端賬單降低59–70%。SWE-bench Lite 10個實例全部通過,成本從54降至54降至27;SWE-bench Pro 19對測試中18對判定一致,單次請求成本降低約60%。該方法有損(精確ID等需保持文本),默認僅處理claude-fable-5請求,可通過PXPIPE_MODELS變量控制。

TIP

來源:Hacker News 熱門(buzzing.cc 中文翻譯)

#2. claude-real-video ─ 讓任何大語言模型(LLM)都能觀看視頻

claude-real-video 是一個開源工具,讓大語言模型基於視頻畫面而非字幕進行理解。它通過場景變化檢測提取關鍵幀、滑動窗口去重並轉錄音頻,生成乾淨的本地文件夾供模型讀取。支持 YouTube 鏈接或本地文件,依賴 ffmpeg 和 Whisper,通過 pip 安裝。全部處理在本地完成,不上傳雲端。

TIP

來源:Hacker News 熱門(buzzing.cc 中文翻譯)

#3. 藏師傅PPT與Pencil結合使用技巧

用戶將藏師傅的AI生成PPT導入Pencil設計軟件,可在Pencil中一次性瀏覽所有頁面並手動調整AI常見的排版問題,如元素重疊、對齊不準、字體錯誤。Pencil提供比PPT更強的編輯能力(對齊、嵌套、打組),支持導出網頁和編輯文件,也可導出PNG後直接放入PPT演示。這種工作流昨天經朋友分享驗證,大幅提升AI生成內容的可編輯性。

TIP

來源:X:歸藏 (@op7418)

#4. Fable 的判斷力:Simon Willison 從 Claude Code 團隊獲得的效率技巧

Simon Willison 在 AIE 上與 Claude Code 團隊交流後建議,讓 Fable(以及 Opus)用自己的判斷力工作,而非硬性規定行為。例如,直接讓 Fable 自行決定何時編寫測試,比給出具體規則更好。為應對價格即將上漲、節省 Fable token,Jesse Vincent 的另一個技巧是告訴 Fable 將較小任務委託給較低功耗模型(Sonnet 用於實質性實現、Haiku 用於機械修改),主循環保留判斷、審計和數據合成等任務。Willison 已將提示詞存入 Claude Code 記憶文件,實際效果良好,Fable token 消耗速度明顯下降。

TIP

來源:Simon Willison 博客

#5. Claude Fable 5 自主優化 AIHOT 網站 SEO/GEO 全記錄

作者用 Claude Fable 5 優化 AIHOT 網站的 SEO 與 GEO。模型自主啟動 22 個 Agent 調研 40 分鐘,發現豆包 App 每天六千多次訪問未被統計等異常。規劃境外加速時,否定 Claude Opus 4.8 的 Cloudflare 方案(無法國內直連/國外分流,且 2025 年起默認攔截 AI 爬蟲),改用火山引擎 CDN。因需白名單,模型自行找到工單入口提交專業工單,22 分鐘開通;發現工程師漏答回源 IP 網段問題,禮貌追問並補充備選方案;發現官方方案有安全漏洞,自行加暗號驗證。23:30 切換域名解析,10 分鐘後 616 個海外請求走新線路。最終生成運維文檔,提醒邊緣證書 10 月 2 日…

TIP

來源:公眾號:數字生命卡茲克

📰 科技風向標 · 2026-07-04
https://illumi.love/posts/日報向/2026-07-04/
作者
𝑰𝒍𝒍𝒖𝒎𝒊糖糖
發布於
2026-07-04
許可協議
🔒CC BY-NC-ND 4.0
分享

如果這篇文章對你有幫助,歡迎分享給更多人!

💬 參與討論
使用 GitHub 帳號登入參與討論