InternLM

不活跃
GitHub Python Apache-2.0

简介

上海 AI 实验室开源的通用大语言模型系列,涵盖 1.8B 到 20B 多规格参数模型,支持长上下文推理、深度思考模式及高效微调,广泛用于对话、推理与代码生成。

核心特性

  • 多规格参数 — 提供 1.8B、7B、20B 等多档位模型,适配不同规模硬件资源
  • 深度思考模式 — 长链式推理能力,支持复杂数学和逻辑推理任务
  • 长上下文窗口 — 最高支持 100 万 token 输入,适合长文档处理
  • 多后端推理 — 兼容 Transformers、vLLM、Ollama、LMDeploy、SGLang 等推理框架
  • 强大评测基准 — 在 CMMLU、MATH、GPQA 等多个基准上达到 SOTA 水平
  • 开源可商用 — Apache-2.0 协议,模型权重和代码完全开放

适用场景

💡 智能对话助手:构建支持深度推理的中文/英文多轮对话系统
💡 长文档分析:处理超长上下文文档,进行总结、问答和信息抽取
💡 数学与编程任务:利用深度思考模式完成复杂数学证明和代码生成
💡 垂直领域微调:基于领域数据对 InternLM 进行高效微调

快速开始

# 安装 Transformers
pip install torch transformers

# 加载 InternLM3-8B-Instruct
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True, torch_dtype=torch.float16)
model.eval()

# 推理
response, history = model.chat(tokenizer, "你好,请介绍一下你自己", history=[])
print(response)

相关项目