InternLM

不活跃

GitHub Python Apache-2.0

简介

上海 AI 实验室开源的通用大语言模型系列，涵盖 1.8B 到 20B 多规格参数模型，支持长上下文推理、深度思考模式及高效微调，广泛用于对话、推理与代码生成。

核心特性

多规格参数 — 提供 1.8B、7B、20B 等多档位模型，适配不同规模硬件资源
深度思考模式 — 长链式推理能力，支持复杂数学和逻辑推理任务
长上下文窗口 — 最高支持 100 万 token 输入，适合长文档处理
多后端推理 — 兼容 Transformers、vLLM、Ollama、LMDeploy、SGLang 等推理框架
强大评测基准 — 在 CMMLU、MATH、GPQA 等多个基准上达到 SOTA 水平
开源可商用 — Apache-2.0 协议，模型权重和代码完全开放

适用场景

💡 智能对话助手：构建支持深度推理的中文/英文多轮对话系统

💡 长文档分析：处理超长上下文文档，进行总结、问答和信息抽取

💡 数学与编程任务：利用深度思考模式完成复杂数学证明和代码生成

💡 垂直领域微调：基于领域数据对 InternLM 进行高效微调

分类

🤖 Agent 框架

快速开始

# 安装 Transformers
pip install torch transformers

# 加载 InternLM3-8B-Instruct
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("internlm/internlm3-8b-instruct", trust_remote_code=True, torch_dtype=torch.float16)
model.eval()

# 推理
response, history = model.chat(tokenizer, "你好，请介绍一下你自己", history=[])
print(response)

访问 GitHub 访问官网查看文档

InternLM

简介

核心特性

适用场景

标签

分类

快速开始

相关项目

Llama 2

Megatron-LM

Agently

Atomic Agents