Awesome LLM 研究论文合集
LLM 研究地图
LLM 研究论文、项目、代码与模型资源精选合集。
92论文
10分类
216资源链接
2026.06最新月份
浏览
研究分类
4 篇论文
注意力机制
围绕 Transformer 内部机制、注意力变体、KV 缓存行为和跨层信息流的研究。
2026.06
注意力架构
18 篇论文
大语言模型
基础模型报告、推理方法、长上下文语言建模、代码与推理系统研究。
2026.05
基础模型、推理、检测
15 篇论文
多模态大模型
连接视觉、视频、动作与语言推理的多模态理解和生成研究。
2026.05
多模态推理、视觉-语言-动作、视觉语言
1 篇论文
嵌入模型
面向检索、语义匹配、表示学习和嵌入模型训练的研究。
2025.06
直接收录
3 篇论文
监督微调
监督微调方法、数据配方、token 加权和推理泛化研究。
2026.05
监督微调方法
2 篇论文
训练
可复用训练配方、监督微调、数据选择、蒸馏和优化实践。
2026.05
优化、蒸馏
32 篇论文
强化学习
奖励建模、RLHF 类优化、推理强化学习、智能体强化学习和 VLA 策略学习。
2026.06
OPD、多模态强化学习、奖励建模、推理强化学习、智能体强化学习、策略优化、视觉-语言-动作强化学习、视频生成强化学习
13 篇论文
智能体应用
智能体系统、工具调用、记忆、AI 研究工作流和可复用技能生态。
2026.05
AI 研究、工具调用、智能体开发、智能体技能、记忆
1 篇论文
视觉
对现代多模态系统有参考价值的计算机视觉方法。
2022.03
目标检测
3 篇论文
自动提示
提示词优化、评测器提示、提示集成和测试时提示学习。
2025.12
提示优化、评测器提示
最新索引
近期论文
2026.06
FlashMemory-DeepSeek-V4: Lightning Index Ultra-Long Context via Lookahead Sparse Attention
注意力机制
2026.06
Rethinking the Divergence Regularization in LLM RL
强化学习
2026.05
GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding
注意力机制
2026.05
The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence
大语言模型
2026.05
Base Models Look Human To AI Detectors
大语言模型
2026.05
Lance: Unified Multimodal Modeling by Multi-Task Synergy
多模态大模型
2026.05
Data Difficulty and the Generalization--Extrapolation Tradeoff in LLM Fine-Tuning
监督微调
2026.05
PowLU: An Activation Function for Stable Pre-Training of LLMs
训练