拥抱开源!发布全球首个中文人力资源模型–伯乐Bole,必优科技开源普惠、共享AIGC!新闻

浏览:623 / 发布:2022-11-10
提及最近爆火AIGC(AI Generated Content)行业,或许很多人便想到了早期的AI写诗、写新闻、写小说之类的文本生成场景,亦或是……

提及最近爆火AIGC(AI Generated Content)行业,或许很多人便想到了早期的AI写诗、写新闻、写小说之类的文本生成场景,亦或是大热的AI作画、AI渲染3D建模、AI视频等设计领域的落地,人工智能技术高速迭代,确实为人类在进步与发展中创造更多的可能。

(图片源于网络)

“人类艺术的发展速度是对数式的,而技术的进步速度是指数式的”

生成式AI相较于 决策式AI,在于“创造”的突破性体验,虽有诸多不理想之处,但却为人类打开了一扇关于机器创造的新世界。

必优科技,作为一家专注于AI内容创作的公司,自成立以来都围绕着内容AI生成而努力,同时秉承“AI技术归于场景”理念,我们更相信在当下的技术发展阶段,生成式AI仍需要强依赖具体的场景才能更好的服务我们,所以必优科技的AI内容创作定位是场景化内容生成AI。

今天,我们正式开源:全球首个中文人力资源语言模型 — 伯乐Bole。

(图片源于微信公众号)

伯乐模型是必优科技自研的场景化语言模型,也是我们在简历内容生成场景下的重大技术产物,开源旨在可以让更多人投入到人力资源场景应用上。

(图片源于微信公众号)

目前伯乐模型已在简历辅写与生成场景上的服务超过2000万次,且在此基础上简历应用服务覆盖到了各大简历用户平台,不仅包括了金山WPS、腾讯文档等办公平台,还有稻壳、爱问办公、简历之家等内容平台,以及实习僧、易展翅等青年招聘求职平台,累计服务用户超过200万+。

开源模型也是希望可以将AI模型力量去最大化的去为人力资源场景带去更多的改变和可能。

“伯乐” 源起:发乎专注,所以改变

公司成立之初,为了验证和探索AI内容生成的在场景化应用的价值,选择的第一个场景便是:简历。作为第一个AI创作场景,选择简历在很多人看来都是不理智的。一方面,简历写作是一个非常颇具争议的场景,稍有不慎可能会沦为“造假之嫌”;另一个方面是其用户量不大、需求低频和偏小众。

但之所以选择这个场景,大抵有两个原因:

第一,场景特殊、用户群体更特殊,简历的用户我们称之为“低职龄化青年”,往往都是5年及以内、包括应届生等职场人群居多,没有太多的求职经验,且不太会写简历,而市面几乎99%的“智能简历”产品能够提供的服务基本的都只是模板或者工具,求职者往往需求更多的是在内容上的帮助,因为真正能够帮助他们找到工作的是简历内容。

为此,我们希望借助AI的力量可以帮助求职者更好的表达自己。

第二,简历场景足够小,加上简历对文本的高要求,我们才能足够专注的起步,这非常能够适合去探索文本生成价值体现的一个场景,去真正检验技术的价值。

为此,我们投入用了2年的时间,在简历场景上不断的深挖与探索,虽没有宏大的AIGC广度覆盖,但却用足够的专注去验证AIGC的应用价值,力求用技术可以为青年求职者构建“ 伯乐 ”,从而辅助更多的青年求职者可以更好、更简单、更有效的写简历。

(图片源于微信公众号)

(图片源于微信公众号)

这也是目前“伯乐”模型名字的由来,借助Bole模型,支撑了我们搭建覆盖了一份简历从0到1的全流程创作节点,“搜(AI生成范文)、写(AI辅写)、投(AI报告)”全程助力,对应的服务也在众多的平台得到了用户的有效验证。

今天,我们选择 开源,更多的是希望可以让这种技术力量可以演化出更多的人力资源应用。

“伯乐”Bole:场景化融合模型

伯乐模型是必优科技首个场景化语言模型,其主要基于Google的Transformer预训练框架,采用 200G+ 相关人力资源数据语料最终训练而成,Large版有 15亿 级参数量,可以满足在人力资源场景大量应用场景,在人力场景下的文本生成、文本分类、情感识别、摘要等任务中,可输出更为精准的内容。

(图片源于微信公众号)

技术定位:知识增强的融合模型

Bole模型最大的特点就是引入多模态图谱知识增强,相较于其他的模型,Bole模型将知识图谱中多模态信息相融合,借由其中所蕴涵的海量知识对模型生成的文本在事理性、逻辑性、真实性等方面的表现进行增强,从而可以让模型的生成任务更加高质量、可控。

(图片源于微信公众号)

特别强调:Bole模型利用的多模态知识图谱增强,也演化出了一套标准的智能范式RFKL,通过标准的新范式,能够尽可能在多行业任务中都能有效保证输入和输出的质量与效果。

性能呈现:小样本训练多场景适应

作为一个典型的行业场景模型,虽然从参数规模上未达到市面的千亿级规模,但是15亿级别参数量却足以在一个行业领域的高专注力,完全可以让我们人力资源场景可以尽可能去是用模型构建我们的AI场景应用。

同时,因为模型的参数规模和场景垂直深度,也是极大可以满足小样本训练的要求,用户只需要借助小样本数据就可以参照自己的业务需求进行fine-tune,从而快速响应快速构建上游任务。模型应用:多场景应用与高迁移性

基于Bole模型,目前必优科技已经在人力资源场景下做了较多的应用拓展与覆盖,同时也得到了百万级用户的验证,极大体现了模型。

(图片源于微信公众号)

文本续写:简历续写、JD续写

文本摘要:人才画像、简历分析、JD报告

文本润色:简历润色

段落生成:简历分析报告、范文生成

对话式生成:HR知识科普、HR-Bot

短词成文:关键词生成自我评价

文本分类:岗位分类、人才分类

多标签:人才标签、JD内容抽取、JD海报

文本纠错:简历信息纠错

……

在人力资源场景涉及到AI内容相关应用超过20+项,应该也是目前国内已知最丰富的人力资源场景AI内容应用,不仅在产品体验中得到了验证,同时也从商业化角度取得了用户高度的价值认可。

“ 世有伯乐,然后有千里马。”

选择对伯乐模型的开放,不仅希望可以为人力资源行业贡献一点微薄之力,同时更多希望能够把这个模型可以借助开源的力量让它可以走的更远,不断共创与探索,也可以真正发挥模型的力量,去寻找属于真正的千里马。

目前模型已经面向全网进行开放,可以直接在必优科技官网进行查看和下载:https://www.yoo-ai.com

(图片源于微信公众号)

同时模型也在Github和Gitee进行上线,可随时搜索关注使用。

(图片源于微信公众号)

最后回到AIGC主题,无论伯乐模型这类场景化AI成文,还是大模型驱动的AI作画,都属于在当下AI技术高速发展下的产物,也是人类文明进步的产物。

虽然在很多地方仍有许多关于机器亵渎或伦理风险的争议,但请敞开胸怀,一起拥抱开放,终将相信AI生成的技术最终的归宿是:人类决策与AI生成的共生共存。

“千里马常有,而伯乐不常有”,拥抱开放,一起见证科技更美好。

联系我们