晶晶是我在一次活动中认识的朋友,工作就是大家熟知的空乘,日常工作是满世界飞。然而她自己却是985院校商科毕业的背景,形成了一个很大的反差。然而更给人反差的是,她竟然自己开始摸索用deepseek和本地知识库,构建自己的数智知识库。
过年期间我写的《本地部署deepseek,创建你的DBA小助理》和《deepseek+RAGFlow,构建DBA小助手的本地知识库》两篇文章,初衷是让更多的朋友对deepseek和DBA工作有个结合点,然而无心插柳柳成荫,却让她点开了自己的新科技树。
从显卡到大模型
但是横在她面前一个问题,硬件怎么配?手里只有一个笔记本电脑,还是集成显卡的。这些东西都是超出她过往知识储备的存在。然后她做了一件很抽象的事,用deepseek去问本地部署一套deepseek,推荐用什么显卡,什么样的硬件配置。好在deepseek回答的很详细,从入门级到最高级大概多少预算,什么样的配置。然后她又把我的文章链接扔给deepseek,最后真得到了一套配置清单。
按照配置清单,在电商找到了极其接近的一套整机,当天下单然后选了最近一班飞机飞回北京。
随后就是按照我写的文档,一步一步摸索,遇事不决就继续问deepseek,中间也零星问过我,只是我以为她仅仅是好奇,并没有往那上面想。
因为原文是基于windows的操作,实际上比linux入门要容易很多,安装ollama,下载deepseek以及配置大模型这些,通过她的磕磕绊绊,都搞定了。但是RAGFlow就一下子让她信息量过载了,docker是什么?github又是啥?向量数据库是个什么东西?agent是做什么用的?对于非计算机专业的人来说,这些都和天书一样。后来听她描述这些,我也意识到,我写的第二篇文章,实际上门槛远远比我想象的要高,只是墨天轮上的主要读者都是技术背景,掩盖了这个问题。
于是我重新去寻找新的本地知识库工具,最终选择了anythingLLM和cherry studio两个直接在windows一键安装并且可以通过点个按钮就可以完成配置的软件推荐给她。在她尝试之下,有很快把本地知识库也搞定了。
部署完了,然后呢
第一个测试用例很快就找到了:滑雪数据的收集。她是一个很喜欢滑雪的女生,雪季恨不得就住在雪场里不回家。本着想要更好滑雪体验,她开始在后面滑雪中收集自己的数据:心率区间、恢复心率时间、过弯频率、板刃角度、滑行时间和最大速率等等。刚开始她是使用excel来手动记录这些,后面根据我的建议,又安装了一套sqlserver,把它们导入到sqlserver里,至于SQL语句,只有大学学过的那点基础,靠着deepseek帮她优化,去查询数据,然后把数据导出给deepseek。她还抱怨过,excel到sqlserver又回到excel是多次一举,但我给她的理由是,多学一个工具总不是坏处。
靠着deepseek给她的优化建议,她在雪场里尝试着调整,得到的结论是:有点用,但是又不是很管用。
滑雪运动的随机性和复杂性决定了,参数很少的deepseek可能没法搞定所有她想要的分析结果,而且还有一个很重要的东西,她的数据误差很可能不小,心率可以靠工具收集,但是入弯还有重力值这些仅靠普通的传感器很可能出来的结果误差范围很随机。而我和她说,不仅仅是滑雪,哪怕是F1这种数据收集非常精准的赛事,目前大模型应用最多的,也仅仅是规则判罚时能够快速提取到对应的规则细节,具体的判罚仍然还需要赛事干事自己裁决。
经历了这个用例之后,她还是放弃了用deepseek来指导自己,而转向了其他方向。
走的人多了也就成了路
偷懒是推进的动力,这一点在晶晶身上也有展现。经历了滑雪这个测试用例之后,她开始思考怎么样为自己日常工作助力。
还是要回到最初,既然都有公版deepseek,本地知识库参数又少,只能往个性化方向走。
比如每次飞完,她会从公司内专业的岗位和软件中获取自己想要的数据。比如塔台、AOC、ELB记录本、运行网,将航班延误情况、客人服务遇到的问题、机舱内的一些细节数据拿到,然后把它们以非结构化文档的形式记录下来,再放到本地模型里。还有就是自己不同时段飞行带来的身体反馈,比如几点到几点飞行异常疲惫等等。尝试着让deepseek来优化自己的作息时间和饮食习惯。不过似乎,仍然效果不是很好。
最后,她决定把重点倾斜到学习上。本着商科的底子,去寻找一些公开数据,将这些公开数据放到本地知识库,来尝试着让大模型进行汇总分析,来验证自己的观点和看法。以及将一些研究报告的个人解读与大模型解读结合起来,去比较两者的异同之处。希望从一些现象背后,去获取到草蛇灰线,伏脉千里的线索。
再后来,故事就朝着很发散的方向前进了,她看见机器人火了,就去找机器人相关的资料往本地知识库扔,哪吒2票房登顶前十,她就找电影行业的东西去让大模型分析。在这一过程中,不断培养自己数据的敏感性,以及拓展自己的知识面。
路是走出来的,新生事物怎么辅助我们,也是在不断探索中前进。如同蒸汽机发明的时候,我们探索出轮船火车,交流电的出现,让医疗和电有了更多交集。而到了AI和大模型的出现,怎么用也是需要一步一步探索出来的。
写这篇文章之前,我还给晶晶看了《00后少女,6年野路子DBA》这篇文章,并且问她,要不要用新的野路子挑战一下这个职业?把你电脑上那套sqlserver,用本地知识库作为辅助运维起来?她不置可否,而我却又觉得,这事似乎可以。
4070ti的显卡,拿来玩怪物猎人荒野一定比我的4060ti好。