Awesome LLM 研究论文合集

LLM 研究地图

LLM 研究论文、项目、代码与模型资源精选合集。

92论文

10分类

216资源链接

2026.06最新月份

浏览

研究分类

注意力机制

围绕 Transformer 内部机制、注意力变体、KV 缓存行为和跨层信息流的研究。

2026.06 注意力架构

大语言模型

基础模型报告、推理方法、长上下文语言建模、代码与推理系统研究。

2026.05 基础模型、推理、检测

多模态大模型

连接视觉、视频、动作与语言推理的多模态理解和生成研究。

2026.05 多模态推理、视觉-语言-动作、视觉语言

嵌入模型

面向检索、语义匹配、表示学习和嵌入模型训练的研究。

2025.06 直接收录

监督微调

监督微调方法、数据配方、token 加权和推理泛化研究。

2026.05 监督微调方法

训练

可复用训练配方、监督微调、数据选择、蒸馏和优化实践。

2026.05 优化、蒸馏

强化学习

奖励建模、RLHF 类优化、推理强化学习、智能体强化学习和 VLA 策略学习。

2026.06 OPD、多模态强化学习、奖励建模、推理强化学习、智能体强化学习、策略优化、视觉-语言-动作强化学习、视频生成强化学习

智能体应用

智能体系统、工具调用、记忆、AI 研究工作流和可复用技能生态。

2026.05 AI 研究、工具调用、智能体开发、智能体技能、记忆

视觉

对现代多模态系统有参考价值的计算机视觉方法。

2022.03 目标检测

自动提示

提示词优化、评测器提示、提示集成和测试时提示学习。

2025.12 提示优化、评测器提示

最新索引

近期论文

2026.06 FlashMemory-DeepSeek-V4: Lightning Index Ultra-Long Context via Lookahead Sparse Attention 注意力机制 2026.06 Rethinking the Divergence Regularization in LLM RL 强化学习 2026.05 GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding 注意力机制 2026.05 The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence 大语言模型 2026.05 Base Models Look Human To AI Detectors 大语言模型 2026.05 Lance: Unified Multimodal Modeling by Multi-Task Synergy 多模态大模型 2026.05 Data Difficulty and the Generalization--Extrapolation Tradeoff in LLM Fine-Tuning 监督微调 2026.05 PowLU: An Activation Function for Stable Pre-Training of LLMs 训练