桥盐是怎么实现的?
za chu lai de ?
在某些情况下,你是不是更需要慢的?
做垂直小模型,只解决好几个方向的问题,就够了
数据集
我们没有这么多的精力与资金,也不会去做大厂们已经做过或在做的事情,不去重复造轮子。我们的数据同样来自全网公开数据,但仅做几个细分垂类的中文数据的收集整理。数据来自:1.2020-至今的万榜所有行业数据与行业分析内容文章&数据表单&报告(已发布及未发布);2.2017年1月-2023年10月(我们没有选用更早的内容,因为过时的信息会对训练结果造成影响)国内我们所聚焦的5个方向的主流文章、观点、认知等内容文档。
由于万榜本身是行业数据统计分析机构,基于万榜创始团队多年跨行业数据与内容积累,万榜所拥有的数据信息均用来进行训练并对桥盐用户相关垂类咨询进行更有效地解答。
训练
我们的数据集完全由我们自身进行筛选、统计、获取和整理,均为公开信息及数据,数据分析专业性经大量投资人、企业家和同行业从业者认可。我们借助dify.ai的数据集训练能力,在我们团队对数据集进行清洗整理后进行定向训练。
在正式投入使用前,已对所有数据集进行训练后测试并反复调整相关参数(说实话没太多参数可调,尽量让效果更好,桥盐大叔尽力了)。
模式
我们借助智谱AI的中文大模型(ChatGLM-Turbo)的能力来做数据集的推理、检索和向量化,将大量文本素材用关键词和语义去碰撞并调整至尽量贴近准确的象限。我们也借助了dify.ai的能力将最终这样一整套分类封装成应用,部分内部借助RPA进行无人自动化操作与使用,部分嵌入桥盐网站给到用户进行互动体验。我们站在巨人的肩膀上,轻量化为用户提供服务。因此,你们也应该知道,向桥盐大叔付的钱里,一定有一部分是用来做训练、算力和无人操作自动化的硬成本,还有团队对数据收集整理分析和清理的人工成本。
所以理论上会有较长一部分时间,付费使用桥盐的状态都会存在,且我们认为有价值的服务一定是值钱的。
AI日趋成熟的时候
我们这些搞数据分析又懂点技术的,想为大家做点什么
桥盐™ 慢AI 2023©Rankborn2023
万榜2019-2023 © Rankborn2019-2023
悦涧(上海)咨询管理有限公司 版权所有