发表日期:2021-01-14 02:52:13文章编辑:admin浏览次数:409 标签:
2020年7月24日,以“新场景·新势能·新动力”为主题,91获客于遵义举办了人工智能产品发布会暨2020渠道大会。
电子科技大学教授、美国亚利桑那州立大学访问学者、91获客首席科学家陈峥博士出席并做《91获客AI2.0演进之路》主题演讲,分享了91获客AI技术在内容写作的成果及2.0的发展。
机器写作的发展与现状
说起机器自动写作,最早要追溯到2009年,美国棒球大联盟首次用智能机器人StatsMonkey通过统计分析,识别比赛期间的重大事件并总结整体比赛动态,自动编写了一篇体育报道。
到2015年,“写稿机器人”在行业中真正爆发。至今,最为成熟和典型的主要是新闻机器人、小说机器人、写诗机器人三类。
新闻机器人一般是基于模板的写作,即使用一个文章模板,将数据库中的结构化信息(包括具体数字、百分比等)填充进去。
小说和写诗机器人更偏向于另外一类,提取后整理、重组,即对包含无用信息的长自然语言文本进行分析,提取文章中的关键信息,重新组织语言后输出。
但都不是真正意义上的机器写作!
严格意义上来说,这些都是属于伪原创工具,存在随意拼凑,模板填空,同义词替换、变换,语义不通顺等等问题,长远来看并不可取。
什么是真正的机器写作
陈峥博士表示,真正的机器写作是需要完全依靠机器自动生成,是通过训练语言模型,对语言进行数学建模,然后不使用原始文本,而是通过人工智能的方式逐句地生成算法认为“最能够体现原文含义而且看起来像一句话”的文字。
如图所示,机器写作是一个学习、训练的结果。其本质是通过找到结果与多维输入之间的关系来进行预测,计算机是没有办法处理语言的,所以需要将自然语言转换为向量才能进行机器学习。
91获客AI1.0 到 2.0量变到质变的过程
1、从隐马尔科夫模型到深度神经网络
首先,隐马尔科夫模型(Hidden Markov Model)是机器写作的初级模型,简单理解,就是一个输入只对应一个输出。
而91获客AI模型是利用深度神经网络(Deep Neural Network)。深度神经网络顾名思义是更加复杂、有深度的多层神经网络,N个输入对应N个输出,不断反复训练,模拟人的思考方式。
2、AI能力参数提升千倍
91获客AI1.0训练模型的参数个数为1.542亿,而当前,我们正在训练的2.0模型数据集容量达到45TB,参数个数1750亿,也就是说即将推出的91获客的AI模型2.0版本将在文本质量及相关性提升一个数量级。
这样的能力值能做什么事情?
前不久OpenAI发布最新的NLP模型,用户只需要输入需求,前端代码会自动生成,就连摸爬滚打几十年的资深IT人士都表示吃惊得说不出话来;另外,在去年DOTA2的顶级赛事TI8上,部分道具和功能禁用的条件下,以2:0完胜了人类冠军......编码AI、游戏AI、内容创作AI等等无不达到一个质的提升。
3、投入大规模硬件,AI计算力不断深化
左图可见,我们的模型参数量处于不断上升趋势,而边际成本在不断降低,这是因我们我们花费了大量资金投入了规模性计算机硬件设备,利用更好的计算机完成最高的算法。
人机共存时代未来可期
陈峥教授对于大家最关心的91获客机器写作几个核心要点进行了回答。
内容生成速度/质量。完全能满足现在的需求。
内容原创度/重复度。100%原创,且风格多样。
是否会被检测到。有可能,但很难。
最后,陈峥教授谈到,社会各界对人工智能需求和呼声越来越大,相信未来也是属于91获客的新时代,91获客将继续发挥AI和大数据技术的协同优势,创造更多跨行业跨领域的创新机遇,为企业营销注入更高更好的“新动能”。
Copyright © 2016-2023 西骏(上海)文化传媒有限公司 版权所有 沪ICP备19035974号-1 网站地图