InternLM
不活跃简介
上海 AI 实验室开源的通用大语言模型系列,涵盖 1.8B 到 20B 多规格参数模型,支持长上下文推理、深度思考模式及高效微调,广泛用于对话、推理与代码生成。
核心特性
- 多规格参数 — 提供 1.8B、7B、20B 等多档位模型,适配不同规模硬件资源
- 深度思考模式 — 长链式推理能力,支持复杂数学和逻辑推理任务
- 长上下文窗口 — 最高支持 100 万 token 输入,适合长文档处理
- 多后端推理 — 兼容 Transformers、vLLM、Ollama、LMDeploy、SGLang 等推理框架
- 强大评测基准 — 在 CMMLU、MATH、GPQA 等多个基准上达到 SOTA 水平
- 开源可商用 — Apache-2.0 协议,模型权重和代码完全开放
适用场景
💡 智能对话助手:构建支持深度推理的中文/英文多轮对话系统
💡 长文档分析:处理超长上下文文档,进行总结、问答和信息抽取
💡 数学与编程任务:利用深度思考模式完成复杂数学证明和代码生成
💡 垂直领域微调:基于领域数据对 InternLM 进行高效微调
分类
快速开始
# 安装 Transformers
pip install torch transformers
# 加载 InternLM3-8B-Instruct
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True, torch_dtype=torch.float16)
model.eval()
# 推理
response, history = model.chat(tokenizer, "你好,请介绍一下你自己", history=[])
print(response)