您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
业界 正文
发私信给梁丙鉴
发送

0

对话衡石科技刘诚忠:AI时代,BI产品的新变化

本文作者: 梁丙鉴   2025-04-14 16:47
导语:以智能化的数据分析服务Chat BI为切口,BI行业找到了AI技术落地的具体场景。

雷峰网讯 用自然语言直接向BI软件提问,查询数据,甚至指挥它进行数据分析,是BI行业的愿景,但过去十余年来未见成功者。直到大模型的出现降低了自然语言查询数据的技术门槛,这一目标终于具有可行性。以智能化的数据分析服务Chat BI为切口,BI行业找到了AI技术落地的具体场景。

作为BI+AI理念下的融合产品,Chat BI支持用户在业务应用中的任何时刻唤起一个聊天助手,用自然语言询问各种经营数据,并即时得到回答。运营方在查看静态报表的同时,也可以就数据变化向AI助手提问,拆解现象背后的原因。从BI到Chat BI,企业在数据运营方面的紧迫性需求、探索性想法将被更好地回应。

在AI科技评论与衡石科技创始人兼CEO刘诚忠的访谈中,他向我们介绍了Chat BI的应用场景与技术路径。2022年大模型浪潮兴起以来,BI行业对于Chat BI落地的技术路径存在NL2SQL和NL2DSL两种思路。前者在数据库表的基础上直接对接大模型进行问答,后者将用户的问题调用BI结构化的查询接口,由BI下发相应查询。

对话衡石科技刘诚忠:AI时代,BI产品的新变化

受访者供图

作为新一代BI公司,衡石在产品构建阶段对已有的BI产品进行了调研,从微软Power BI和Looker的经验中发现语义层是BI产品数据分析能力的基础,决定将工程团队的精力集中在加强语义层能力上。而语义层通过定义业务友好的术语和概念,为DSL的构建提供简化的数据视图,DSL可以基于该视图来设计更贴近业务的语法和语义。

AI时代到来后,BI侧的语义层能力和AI侧的大模型完成了双向奔赴。大模型不需要把自然语言翻译成SQL层次的底层语言,在问数场景中,只需要与中间的语义层进行交互。衡石基于自身语义层的优势,降低对大模型提出的要求,走通了NL2DSL的技术路径。

随着模型分析能力的提升,未来Chat BI还将帮助用户生成分析报告,针对数据的走势、关联关系以及数字背后隐藏的洞察,提供更清晰的解读。刘诚忠判断,大模型对数据趋势进行预测和解读的能力,可能在今年晚一些时候或明年被大幅增强。

以下是AI科技评论与刘诚忠的对话全文,为方便阅读,进行了不改变原意的文字调整。

 

为什么选择做BI

AI科技评论:为什么选择做BI产品?这个赛道有哪些选手?

刘诚忠:BI更有成为标准化产品的潜力。BI 本质上是一个用于统计分析的大数据产品,而且对分析数据的种类并不限制。企业的数据分为几个板块,财务、ERP、marketing、sales和HR,每个业务都可以用。在BI赛道,主流厂商包括微软、Tableau、帆软、永洪科技、思迈特软件、观远数据、衡石科技等等公司。

 

AI科技评论:衡石的BI有什么不同?

刘诚忠:我们产品的核心特点是开放架构,比较像一个BI引擎,可以服务直客,但更多地作为嵌入式产品面向应用软件厂商。这种以嵌入集成为主的产品形态和合作方向,使衡石在BI赛道具有一定的差异化定位,因此在国内几乎没有竞争对手。客户倾向于将衡石定义成BI Engine或 BI PaaS,本质上都是在形容衡石的定位。

 

AI科技评论:除了衡石,国内SaaS厂商在嵌入式BI产品方面还有什么选择?

刘诚忠:除了衡石,国内SaaS厂商的选择通常是自研。软件厂商的工程师们对于BI功能往往忍不住会自研,但数据分析和 BI 的自研成本其实非常高,因此许多客户都在都是自研上吃了大亏后找到我们。

自研的必然结果,就是虽然可以做出来,但它会是一个非常轻量的东西。通常自研 BI 需要的团队规模为5~10 人,周期1~2年。BI的基础工程较为容易,可以在这个条件下完成,但后续建模分析、数仓对接权限控制等精细、复杂工程所需的进一步投入会给研发投入造成巨大压力。很多公司会发现做到这儿的时候,开发投入已经跟自己主业需要的水平差不太多了,那就显得不合理。一个做 ERP 的公司,投一堆人做BI,但事实上 BI 这样的数据类基础工具软件的投入就是未必低于 ERP。

 

AI科技评论:有企业自研 BI 成功的案例吗?

刘诚忠:全球范围看也是几乎没有的,就算软件巨头如谷歌、Salesforce需要这部分能力也不会自研,会直接发起并购。国内看到阿里自研BI产品比较成功。他们的产品可以在阿里云上服务自己的电商群体,这部分群体同时也在滋养产品,所以阿里对产品的打磨可以得到市场反馈。产品是靠市场反馈推着走的,如果一家企业BI产品的反馈来自于自身业务部门,不能代表市场的反馈,也就无法形成市场竞争力。

 

Chat BI:BI+AI融合之旅

AI科技评论:大模型的发展会挤压BI厂商的生存空间吗?

刘诚忠:基本上从2022年底开始,所有的BI厂商都在第一时间关注大模型。因为如果大模型一出现就把toSQL的问题解决得很好,那BI厂商就很危险,大家担心要被折叠了。差不多24年大家才发现,基于BI去做AI在数据分析上的落地是更务实的,BI这一层应该没有办法被替代,BI+AI这种合作慢慢地才多起来。25年开始,合作的线索和机会开始成数倍的增加。

对BI厂商来说,23年是观察的一年,24年是共识形成的一年,25年应该就是快速成长兑现共识的一年。

 对话衡石科技刘诚忠:AI时代,BI产品的新变化

受访者供图

AI科技评论:BI产品怎么和AI技术结合?有哪些应用场景?

刘诚忠:做智能化的问数助手,给企业提供智能化的数据分析服务。衡石从为SaaS软件市场提供BI,升级为提供 Chat BI。后者支持用户在业务应用中的任何时候唤起一个聊天助手,用自然语言询问各种经营数据,并即时得到回答。在数据运营方面,这种随时可以问到某一个数据的服务是之前不存在的。用户需要询问分析师,分析师制作报表,再进行调整,这是一个很低效的过程。现在可以用Chat BI解决一些紧迫的随需而变的探索问题,这种ad-hoc的需求是很旺盛的。

另外用 BI 工具做出静态报表给运营方看的时候,Chat BI会有一个AI助手。运营方可以在看报表的同时,随时提一些探索性的想法。比如他看到报表的某个数据上升了,就会问是哪个维度上增加了什么东西导致的。这个现象分解出来,原因具体在哪里,这些探索可以马上进行,实时的反馈。

 

AI科技评论:不同的大模型对Chat BI有区别吗?

刘诚忠:区别很大,问数的核心就是大模型能不能准确理解问题,有的大模型更准,有的就不准。GPT-4o效果很好,DeepSeek和千问也不错。但对接大模型的过程相对来说是标准化的,因为大模型对外暴露的接口就是prompt。不管这个模型是不是开源的,Chat BI把query给它,它以语义层的语法返回,由BI平台再翻译成SQL,完成对数据的查询,把聚合的结果反馈给客户。

 

AI科技评论:未来Chat BI的产品形态会是Agent吗?

刘诚忠:衡石现在的Chat BI还是面向真人,比如通过报表旁边的聊天窗口,或者向飞书里的bot提问。但未来有很多情况下会是一个Agent或者AI来和衡石对话,所以我们对外要提供for Agent的一层,使它可以被别的Agent所识别、辨认和调用。

我们以后对外就是一个企业级的 BI Agent。衡石已经和Dify集成,用户可以在Dify里完成一个复杂的任务,它分解后其中一步是查询数据,这一步是衡石在支撑服务。Agent查询,Chat BI进行响应,然后Agent再回到工作流里。我们作为支持性的企业级Agent进入一个复杂的任务编排里,承担其中智能问数的环节。

 

NL2DSL:语义层和大模型的双向奔赴

对话衡石科技刘诚忠:AI时代,BI产品的新变化

受访者供图

AI科技评论:为什么采用NL2DSL的技术路线?

刘诚忠:自然语言对数据灵活提问的功能是BI行业十多年来的想法和尝试,也是 BI 行业的技术趋势。Tableau还专门收购过一家做NLP的公司,效果也不是很成功。原因在于,大语言模型出现之前这项技术非常不成熟,它出现之后通过自然语言查询数据才具有可行性。

创业做产品构建的时候,我们就决定将工程团队的精力集中在加强语义层能力上,但当时的考虑和AI无关。语义层是 BI 做数据分析的基础能力,power BI在这方面做得很好,所以分析能力就强过别的 BI 工具。衡石是2016年创立的,算新一代BI公司,当时把这些产品都研究过,我们发现了语义层在整个产品演进过程中至关重要的作用。2019年,衡石在语义层上就做得不错了。

(注:衡石采用NL2DSL的方式,将自然语言的询问翻译为指标描述语言,由BI层进一步翻译为SQL进行下推查询。)

 

AI科技评论:语义层上的技术优势在AI时代有什么意义?

刘诚忠:语义层在BI上的优势,在 AI 上也是优势。大模型出来之后,可以说语义层能力更有用武之地,不需要大模型把自然语言翻译成SQL那么底层的语言,只需要翻译成中间语义层的语言即可,这对大模型提出的要求更低了。其实也只有降低对大模型的要求,Chat BI才更有可行性。因为从技术路线的角度,大模型不擅长精准的数据分析场景,这也不是大部分模型厂商要发力的领域。长期来看,BI行业的落地应用门槛下降了,数据分析和数据智能应用更加普及,AI是所有BI厂商的红利。

 

AI科技评论:AI还给BI行业带来了什么影响?

刘诚忠:除了直接的问数,对分析报告生成也会有帮助,但这种帮助很大程度上依赖于垂直领域知识,这是 AI 目前跟数据结合还不太成熟的方面。AI数据分析现在是第一阶段,用户对很多指标的提问可以马上被准确识别。第二阶段是对于数据的走势、关联关系以及数据背后隐藏的洞察,可以给人更清楚的解读。我们判断,大模型对数据趋势进行预测和解读的能力,可能在今年晚一些时候或明年会被比较大幅地增强。但这个我们判断取决于垂直领域模型的进展,才能真正落地。

 

AI科技评论:这是否对大模型的分析能力提出了更高的要求?

刘诚忠:这需要它有非常强的分析能力。大模型技术的基础趋势会让它的分析能力越来越好,但目前的推理模型还不太实用,所以我们主流使用的大模型还是DeepSeek-V3。我们也在观察DeepSeek-R1,但是在问数、解读报告生成的场景中它并没有特别的优势。同时,关键还在于垂直领域的行业性数据作为关键语料对垂直模型的帮助,不只是大模型单方面的瓶颈。

 

AI科技评论:你评价模型性能更关注它在具体行业场景中的实用性吗?

刘诚忠:大家真正关注的是零售、制造、医疗这些具体行业,一项技术如果很先进,最重要的是能拿来使用。比如BI,我们关注的是能不能落地到数据分析、分析报表可视化的具体场景里,因此会从一个很实用的角度来考察 AI 的能力。每个行业自己的需求都很现实,行不行拿过来试一下。

 

AI科技评论:To B服务中没有用户敢相信大模型随机输出的内容,但AI的本质就是寻求概率,所以大模型使用效果会不会不稳定?

刘诚忠:对,所以大模型在To B落地很困难。To B就是要精准,现在模型的能力在严肃数据的场景中太稚嫩,我们没有看到太多的检验和落地的实在效果。我们的价值也是在大模型能力不够高的现状下努力提升他的精准性。企业用大模型直接问数的准确率可能只有30%,我们BI能帮它提高到80%、90%以上,基本达到可落地的程度。

(雷峰网(公众号:雷峰网)文章)


雷峰网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
Baidu
map