一、企业大模型场景落地的关注点和痛点
规划:前期如何规划?
如何统一规划整体架构? 并发支持、响应速度 租用还是自建 算力需求多大 商用还是开源?是否全部采用 DeepSeek R1? 本地还是云端 统一规划还是各自尝试 服务于哪些业务目标 目标 大模型 算力 性能 数据安全性考量 总体多少预算
选型:技术路线怎么选?
如何做合理的技术选型? 对大模型的要求 是不是只要大模型就够了 需要大模型做微调 构建行业大模型 各类场景分别选用什么样的大模型合适 DeepSeek R1 适合哪些场景? 落地方法 使用各种 RAG 技术做落地,还是需要融入图技术 问数应该是 Text2SQL,还是 Text2 指标?
落地:如何有好的效果?
如何做到结果可信 如何减少幻觉 如何保证结果可解释 如何做到效果好 为什么换一份数据效果不好 表格、图片效果如何 简单问题可以处理,复杂问题回答不了 可以做混合问答么,问答和问数融合在一起 如何保证数据安全性 数据权限
场景:如何选定高价值场景?
目标用户是谁,有什么痛点? 应该如何找场景? 需要哪些人参与 如何找到高价值场景 业务成熟度如何? 是否高频、重复、标准 数据情况如何? 已有数据,持续迭代情况? 技术成熟度 是否可以支持场景实现?
- 价值
包括成本投入降低、自主决策能力增强、自主可控安全、行业模型推理、蒸馏小模型推理、复用能力沉淀。 - 优势
有低训练 & 推理成本、推理能力佳、国产化、强化学习、领域知识蒸馏、低代码工具 。 - 流程
从 DeepSeek R1 基础模型出发,经 SFT(有监督微调)和 RF(强化学习 ),利用行业推理数据,先构建带推理能力的行业大模型,再通过 SFT 得到带推理能力的专有蒸馏小模型。 - 数据
涉及行业公开数据和私有数据集 。
企业数据
企业各类格式文档 企业数据库 企业指标系统 视频 图片数据 组织机构数据 外部各类数据(舆情、论文、专利..) …
关系构建
数据血缘
根据结构化数据之间的关系,构建数据血缘链路 根据非结构化数据的关系,构建数据血缘关系,包括分片、段落、文档,知识库等
结构化数据图构建
根据元数据梳理自动化构图,比如社交网络、供应链等
非结构化数据
大模型进行实体关系抽取 根据抽取的反馈,大模型微调 基于微调大模型做实体关系抽取 人工校验并入图 视频 图片 / 音频:先结构化,再抽取关系
非结构化数据文档段落关系构建
根据段落抽取对应的图 包括分级目录结构 切片前后关系 文档片段与标签的关系
结构化非结构化数据关系构建
组织机构关系 作者与文档、代码、工作项的关系 文档引用关系 根据关系自动构建































文章转载自会飞的一十六,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




