共 22 篇文章
DEFT(Distribution-guided Efficient Fine-Tuning)是發表於 EMNLP 20
VLA(Vision-Language-Action)模型是當前機器人研究的主流框架——讓模型同時理解視覺畫面、語言指令
大型語言模型(LLM)的安全對齊行為,在下游任務微調(Fine-tuning, FT)後往往出現漂移——即便訓練資料完全
**人類對齊(Human Alignment)**是當前 LLM 開發中最關鍵也最棘手的問題之一:如何讓語言模型的輸出符
大型語言模型(LLM)在部署前通常需要針對下游任務進行微調(fine-tuning),但這個過程存在一個危險的副作用:*
醫療 AI 的下一個演化方向,不再只是預測(「這位患者未來 30 天住院風險是 X%」),而是理解**因果**(「是哪個
隨著生成式 AI(AIGC)技術快速演進,合成圖像在解析度與語意一致性上已逼近真實照片,使人眼辨識幾乎不可能。傳統 De
高分子(聚合物)材料工程長期依賴試錯法——研究人員根據直覺與經驗合成新分子,再逐一實驗測試其性質。這條路徑緩慢且昂貴。本
以擴散模型(Stable Diffusion、DALL·E 3、Midjourney)為代表的生成式 AI 快速演進,使
大型語言模型要安全落地,不只是訓練它「說什麼」,更要讓它知道「什麼不該說」、「說到什麼程度才有用」。這就是對齊(Alig
野火已成為氣候危機最直接的破壞力之一。精確的時空蔓延預測攸關疏散時機與消防資源調度,但現有方法多依賴靜態物理規則或單一時
**論文資訊**
LLM 代理面臨一個根本性瓶頸:上下文視窗有限,而現實任務往往跨越長時程、需要跨步驟記憶。當前主流做法將長期記憶(LTM
本論文提出一套以 LLM 推理能力驅動動態控制的框架,核心思路是:讓語言模型不只作為「規劃者」,而是直接承擔低層控制策略
> 論文摘要:Kendre 等人(2026)探討 GAN、擴散模型與多模態 Transformer 如何重塑政治藝術,以
失智症(Dementia)是以漸進式認知退化、行為改變與記憶喪失為核心特徵的神經系統疾病,全球受影響人口超過 5500
生醫多模態 AI 長期面臨一個結構性矛盾:效能最強的系統(如 GPT-4V、Gemini Ultra)幾乎全為閉源,醫療
讓視覺語言模型(VLM)具備更豐富的多模態理解能力,傳統做法是收集人類偏好標注資料,再透過 RLHF 或 DPO 進行對
當前主流視覺語言(Vision-Language, VL)模型——無論是大型語言模型搭配視覺編碼器、文字轉圖片擴散模型,
藥物資產盡職調查(Drug Asset Due Diligence)是生技/製藥投資中最耗時的環節之一:投資人在決定是否
此研究(Deshmukh 等人,2026)探索以 LLaMA 3(Meta AI version 3)自動化履歷初篩流程
訓練 LLM Agent 在真實環境中執行工具互動任務,一直面臨三個根本障礙:真實系統難以直接存取(權限、安全性)、用