第一百一十七章 百科狂人马百万
作为对蜜蜂科技延期推出《诛仙剑》电视剧和动画片的补偿,BJPW公司把手机游戏改编权留给了蜜蜂科技,蜜蜂OS版《诛仙剑》游戏已经在紧张制作中了。
蜜蜂科技公司美工部和策划部近期最大的任务便是为这个手机游戏准备素材。
作为改编游戏,《诛仙剑》动画版可以为手机版提供大量人物动作、场景画面、音效特效现成资源。因为手机ROM容量有限,手机处理器GPU芯片处理能力也不怎样,所以他们需要选好素材,然后使用工具将图像、音频、视频动画进行压缩,甚至有时候还要完全重绘画面。
总归减法比加法好做,倒也不算太难,甚至于他们还可以一定程度上发动中临协网站上数万临时工参与进来。可以提供一些原始素材让临时工们将其改造成指定内容主题特定规格的素材。
当然出于保密考虑,这些原始素材里面自然不能有类似“烧火棍”、“合欢铃”等太过特色化,指向性明确的内容,最多也就是到“白衣仙子”、“绿衣小魔女”、“顽皮猴子”这个层次,大多数时候都是山林宫殿等等场景画面。
因为马竞一时兴起而创建的中临协网站,在马竞有意扶持之下,现在已经有了超过十万活跃会员、日平均点击量过百万,成为国内众包网站里面毫无疑问的第一。
众包(Crowdsourcing,群体采购)指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。众包的任务通常是由个人来承担,但如果涉及到需要多人协作完成的任务,也有可能以依靠开源的个体生产的形式出现。
众包是外包(Outsourcing)的对立,外包是把企业根据自身的需要将运营工作中的某一项或是所有项外包出去,由专业的组织或机构进行运作,以减少人力投入、减少企业投资、降低成本,实现效率最大化。
外包是高度专业化的,像是蜜蜂科技的会计、保洁、盆景装饰、后勤设备维护等业务都外包给了专业的外包公司来做。而众包则不太强调接受目标的专业性,这样就带来了一个问题,不专业人士的参与不可避免导致他们的工作效果良莠不齐,影响最终产品品质。像是维基百科和度娘百科任何人都可以编辑词条的内容,因此一些词条质量优秀,一些词条这粗制滥造,只是简单从别处复制粘贴而来,甚至出现了“恶意修改词条”与“故意发布广告词条”的情况。
这是“众包模式”先天上的顽疾,国内类似的威客模式(witkey)采用“招标模式”预先审查任务申请者,试图用这种方式来避免参与者专业性不够的问题。
马竞的中临协网站则使用人工智能来处理这个问题,“雇主”和“临时工”们在中临协网站上面发布的内容都要经过人工智能语意检查引擎的检查,符合列表内指定情况的内容会被拦截无法发布。
这个“拦截列表”则是由马竞、蜜蜂员工、中临协资深会员等共同创建并且不断增添的,能够有效减少不专业、明显不正确(逻辑语义问题、答非所问)、广告、恶意攻击等内容的上传。
不愿吃亏的马竞甚至把这个“人工智能语意检查引擎”做成了客户端程序,部分复杂任务需要通过“中临协客户端”进行发布和完成。像是召集临时工参与“某仙侠手机游戏的开发”这样的任务就需要用到客户端。
这个客户端不止有语意检查引擎,还是一个简化版的在线协作办公系统,组成工作小组的临时工们可以通过这个软件进行在线协助,像是手游改编项目里面很多剧情段子与力量体系设定就是依靠的这个协同办公来完成的。
“语意检查引擎”被应用于所有蜜蜂科技旗下网站,根据网站性质不同,语意检查的级别和侧重点也不同。
像是游戏软件官方bbs只专注软件使用体会与意见建议,其他内容的话题就会被拦截,无论是广告贴还是各种引占钓鱼贴。
而像是中临协百科和中临协问答这两个子站语意检查引擎则强化了“内容查重”功能,避免复制粘贴。在问答站发布问题时如果网站上已有同样问题,就会被合并进去,答案中大段引用其他网站内容则会被标注“本段来自某某网站”的自动标记。
因为是结合在语意检查引擎里面的,中临协网站的查重引擎效力非常强大,普通防屏蔽的方法比如加入其他文字和符号、使用同音字、同义字、形似字等,并不能逃过检查软件的法眼。
不少大学生用户因此逐渐使用“中临协客户端”作为他们的论文查重引擎,效果相当好。这是因为马竞到开通鹭大图书馆网络平台以后,同时也把这个重量级数据来源引入查重引擎的结果。
虽然词条数、问题数没有发展更早的度娘百科和度娘知道多,累计完成任务数也没有witkey多,但是中临协网站后发制人,凭借蜜蜂浏览器长期引流、蜜蜂科技倾力支持,在总交易额和任务类型总数两样数据上完爆了其他众包/威客网站,在内容准确性上面完爆了度娘,甚至在准确率指标上直追在线百科始祖维基百科。
到今年,维基百科已有210多种语言的版本,词条数超过350万,英文版条目数已经超过100万条。这个开放的在线百科全书正在经历爆炸式的发展,它已经是目前世界历史上最大的百科全书。
2005年12月14日,英国《自然》杂志随机从维基百科(wiki)抽取了42个和科学技术有关的条目并请专家与不列颠百科全书(EB)进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,“业余网友“打造的维基平均每条的“错误”只比芝加哥大学数百名专家持续编写的不列颠百科全书多出一个。尽管大英百科方面声称自然杂志的调查有几处证据不是来自EB本身,但是基于自然杂志在科学界的地位,大众还是相信了这个匪夷所思的结果。
虽然马甲并没有做同样的抽查,但他还是确信自己打造的中临协百科比这二者更加准确。
2005年12月14日,英国《自然》杂志随机从维基百科抽取了42个和科学技术有关的条目并请专家与不列颠百科全书进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,维基平均每条的“错误”只比不列颠百科全书多出一个。维基百科在发展的过程中也推出了一系列措施来提高条目的准确性与权威性,比如制定条目质量标准、进行特色条目的评选、采用“专题”的方式为某一特定领域范围内的条目撰写提供一个模板(应该包括哪些内容,资料如何排列与组织等)、实行“条目质量提升计划”(通过投票方式定期挑选出需要提升质量的条目放置在主页的显著位置,确定条目的框架与提纲,在规定的期限内完成更新)。
一方面,中临协百科初始版本的80万词条都是马甲整理“编写”的,内容来自《辞海》(99版12万)、《现代汉语词典》(05版6万5)、《大英百科全书》(网络版22万5)、《牛津英汉双解词典》(40万)、《汉语字典》(6万)等成名工具书和马竞看过的各种教科书,以及竞争对手度娘百科和维基百科。
另一方面,这些词条都由马竞通过E7U批量创建,借助反向使用“人工智能语意检查引擎”,可以与时俱进更新资料内容,同时保持描述的权威客观专业。而且借助机器人工智能,可以避免一些人为因素导致的文字错误、歧义误解等问题,可以进一步提高准确性。
另外语意引擎也为每个词条提供多语言版本,尽管只有中(繁中)、英(美)两种语言四个版本。
这些词条词条的创建者名字叫做“马海生”,就是马竞为了纪念自己转换词条时在海水里泡着的一个多月而特地取的。
在中临协百科的贡献榜上面,马海生高居榜首,以统计159万词条贡献数遥遥领先,第二名只有300多。这个史无前例、空前绝后的壮举惊呆了一堆网站会员,被称为“百科超人马百万”。
因为这件事马竞足足瘦了十斤,这还是大量补充营养,进食量堪比相扑运动员的结果,直到军训后马竞的体重才回复到健康体重。
“饭桶级食量”也慢慢降了下去,但还是比普通人多——马竞一个人饭量相当于宿舍剩下三个人的总和,但是怎么吃都不发胖,让高胖的刘海洋是羡慕不已。
其实这是马竞在电子人转化进度进入末期,生成第三种电子人特有“能量物质”的正常反应,这是一种能量密度是脂肪三倍,每克燃烧值超过120千焦接近液氢的高能量密度物质。
其具体成份马竞并不清楚,只能猜测应该还是某种碳氢化合物,毕竟他并没有大量摄入别的元素。
而在马竞开学报道以后,因为不能长时间泡水降温,马竞顺势开放中临协百科的编辑权限,允许其他用户创建、修改词条。
一有时间马竞还是会把其他用户编写的词条现在下载到脑盘里面,利用游泳洗澡的时间调用E7U对其进行分析整理修改,并且生成其他语言的四个版本,随后以“马海生”的名义上传到服务器上。
蜜蜂浏览器和蜜蜂输入法上面也都有直通中临协百科的快速入口,相当于多了一个在线的英汉双解词典和百科全书插件。
在用户使用蜜蜂浏览器和蜜蜂输入法时,按住ctrl或者其他预设快捷键,鼠标划词选定文字或者词组可以实现快速搜索,如果有对应词条,则会在屏幕上以一个气泡提示卡的形式通知用户。
不同之处在于浏览器的搜索插件支持划词搜索,直接拖动选中文本然后再次拖动就可以搜索,而输入法的搜索插件却需要按键才可以拖动选择文本。不过输入法在输入框上面也继承了简要的语意框,可以借助网络快速显示词组意思与输入码。
蜜蜂科技公司美工部和策划部近期最大的任务便是为这个手机游戏准备素材。
作为改编游戏,《诛仙剑》动画版可以为手机版提供大量人物动作、场景画面、音效特效现成资源。因为手机ROM容量有限,手机处理器GPU芯片处理能力也不怎样,所以他们需要选好素材,然后使用工具将图像、音频、视频动画进行压缩,甚至有时候还要完全重绘画面。
总归减法比加法好做,倒也不算太难,甚至于他们还可以一定程度上发动中临协网站上数万临时工参与进来。可以提供一些原始素材让临时工们将其改造成指定内容主题特定规格的素材。
当然出于保密考虑,这些原始素材里面自然不能有类似“烧火棍”、“合欢铃”等太过特色化,指向性明确的内容,最多也就是到“白衣仙子”、“绿衣小魔女”、“顽皮猴子”这个层次,大多数时候都是山林宫殿等等场景画面。
因为马竞一时兴起而创建的中临协网站,在马竞有意扶持之下,现在已经有了超过十万活跃会员、日平均点击量过百万,成为国内众包网站里面毫无疑问的第一。
众包(Crowdsourcing,群体采购)指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。众包的任务通常是由个人来承担,但如果涉及到需要多人协作完成的任务,也有可能以依靠开源的个体生产的形式出现。
众包是外包(Outsourcing)的对立,外包是把企业根据自身的需要将运营工作中的某一项或是所有项外包出去,由专业的组织或机构进行运作,以减少人力投入、减少企业投资、降低成本,实现效率最大化。
外包是高度专业化的,像是蜜蜂科技的会计、保洁、盆景装饰、后勤设备维护等业务都外包给了专业的外包公司来做。而众包则不太强调接受目标的专业性,这样就带来了一个问题,不专业人士的参与不可避免导致他们的工作效果良莠不齐,影响最终产品品质。像是维基百科和度娘百科任何人都可以编辑词条的内容,因此一些词条质量优秀,一些词条这粗制滥造,只是简单从别处复制粘贴而来,甚至出现了“恶意修改词条”与“故意发布广告词条”的情况。
这是“众包模式”先天上的顽疾,国内类似的威客模式(witkey)采用“招标模式”预先审查任务申请者,试图用这种方式来避免参与者专业性不够的问题。
马竞的中临协网站则使用人工智能来处理这个问题,“雇主”和“临时工”们在中临协网站上面发布的内容都要经过人工智能语意检查引擎的检查,符合列表内指定情况的内容会被拦截无法发布。
这个“拦截列表”则是由马竞、蜜蜂员工、中临协资深会员等共同创建并且不断增添的,能够有效减少不专业、明显不正确(逻辑语义问题、答非所问)、广告、恶意攻击等内容的上传。
不愿吃亏的马竞甚至把这个“人工智能语意检查引擎”做成了客户端程序,部分复杂任务需要通过“中临协客户端”进行发布和完成。像是召集临时工参与“某仙侠手机游戏的开发”这样的任务就需要用到客户端。
这个客户端不止有语意检查引擎,还是一个简化版的在线协作办公系统,组成工作小组的临时工们可以通过这个软件进行在线协助,像是手游改编项目里面很多剧情段子与力量体系设定就是依靠的这个协同办公来完成的。
“语意检查引擎”被应用于所有蜜蜂科技旗下网站,根据网站性质不同,语意检查的级别和侧重点也不同。
像是游戏软件官方bbs只专注软件使用体会与意见建议,其他内容的话题就会被拦截,无论是广告贴还是各种引占钓鱼贴。
而像是中临协百科和中临协问答这两个子站语意检查引擎则强化了“内容查重”功能,避免复制粘贴。在问答站发布问题时如果网站上已有同样问题,就会被合并进去,答案中大段引用其他网站内容则会被标注“本段来自某某网站”的自动标记。
因为是结合在语意检查引擎里面的,中临协网站的查重引擎效力非常强大,普通防屏蔽的方法比如加入其他文字和符号、使用同音字、同义字、形似字等,并不能逃过检查软件的法眼。
不少大学生用户因此逐渐使用“中临协客户端”作为他们的论文查重引擎,效果相当好。这是因为马竞到开通鹭大图书馆网络平台以后,同时也把这个重量级数据来源引入查重引擎的结果。
虽然词条数、问题数没有发展更早的度娘百科和度娘知道多,累计完成任务数也没有witkey多,但是中临协网站后发制人,凭借蜜蜂浏览器长期引流、蜜蜂科技倾力支持,在总交易额和任务类型总数两样数据上完爆了其他众包/威客网站,在内容准确性上面完爆了度娘,甚至在准确率指标上直追在线百科始祖维基百科。
到今年,维基百科已有210多种语言的版本,词条数超过350万,英文版条目数已经超过100万条。这个开放的在线百科全书正在经历爆炸式的发展,它已经是目前世界历史上最大的百科全书。
2005年12月14日,英国《自然》杂志随机从维基百科(wiki)抽取了42个和科学技术有关的条目并请专家与不列颠百科全书(EB)进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,“业余网友“打造的维基平均每条的“错误”只比芝加哥大学数百名专家持续编写的不列颠百科全书多出一个。尽管大英百科方面声称自然杂志的调查有几处证据不是来自EB本身,但是基于自然杂志在科学界的地位,大众还是相信了这个匪夷所思的结果。
虽然马甲并没有做同样的抽查,但他还是确信自己打造的中临协百科比这二者更加准确。
2005年12月14日,英国《自然》杂志随机从维基百科抽取了42个和科学技术有关的条目并请专家与不列颠百科全书进行比较,结果发现,维基百科共有162项事实性的错误、疏漏或误导性的陈述,不列颠百科则有123项,维基平均每条的“错误”只比不列颠百科全书多出一个。维基百科在发展的过程中也推出了一系列措施来提高条目的准确性与权威性,比如制定条目质量标准、进行特色条目的评选、采用“专题”的方式为某一特定领域范围内的条目撰写提供一个模板(应该包括哪些内容,资料如何排列与组织等)、实行“条目质量提升计划”(通过投票方式定期挑选出需要提升质量的条目放置在主页的显著位置,确定条目的框架与提纲,在规定的期限内完成更新)。
一方面,中临协百科初始版本的80万词条都是马甲整理“编写”的,内容来自《辞海》(99版12万)、《现代汉语词典》(05版6万5)、《大英百科全书》(网络版22万5)、《牛津英汉双解词典》(40万)、《汉语字典》(6万)等成名工具书和马竞看过的各种教科书,以及竞争对手度娘百科和维基百科。
另一方面,这些词条都由马竞通过E7U批量创建,借助反向使用“人工智能语意检查引擎”,可以与时俱进更新资料内容,同时保持描述的权威客观专业。而且借助机器人工智能,可以避免一些人为因素导致的文字错误、歧义误解等问题,可以进一步提高准确性。
另外语意引擎也为每个词条提供多语言版本,尽管只有中(繁中)、英(美)两种语言四个版本。
这些词条词条的创建者名字叫做“马海生”,就是马竞为了纪念自己转换词条时在海水里泡着的一个多月而特地取的。
在中临协百科的贡献榜上面,马海生高居榜首,以统计159万词条贡献数遥遥领先,第二名只有300多。这个史无前例、空前绝后的壮举惊呆了一堆网站会员,被称为“百科超人马百万”。
因为这件事马竞足足瘦了十斤,这还是大量补充营养,进食量堪比相扑运动员的结果,直到军训后马竞的体重才回复到健康体重。
“饭桶级食量”也慢慢降了下去,但还是比普通人多——马竞一个人饭量相当于宿舍剩下三个人的总和,但是怎么吃都不发胖,让高胖的刘海洋是羡慕不已。
其实这是马竞在电子人转化进度进入末期,生成第三种电子人特有“能量物质”的正常反应,这是一种能量密度是脂肪三倍,每克燃烧值超过120千焦接近液氢的高能量密度物质。
其具体成份马竞并不清楚,只能猜测应该还是某种碳氢化合物,毕竟他并没有大量摄入别的元素。
而在马竞开学报道以后,因为不能长时间泡水降温,马竞顺势开放中临协百科的编辑权限,允许其他用户创建、修改词条。
一有时间马竞还是会把其他用户编写的词条现在下载到脑盘里面,利用游泳洗澡的时间调用E7U对其进行分析整理修改,并且生成其他语言的四个版本,随后以“马海生”的名义上传到服务器上。
蜜蜂浏览器和蜜蜂输入法上面也都有直通中临协百科的快速入口,相当于多了一个在线的英汉双解词典和百科全书插件。
在用户使用蜜蜂浏览器和蜜蜂输入法时,按住ctrl或者其他预设快捷键,鼠标划词选定文字或者词组可以实现快速搜索,如果有对应词条,则会在屏幕上以一个气泡提示卡的形式通知用户。
不同之处在于浏览器的搜索插件支持划词搜索,直接拖动选中文本然后再次拖动就可以搜索,而输入法的搜索插件却需要按键才可以拖动选择文本。不过输入法在输入框上面也继承了简要的语意框,可以借助网络快速显示词组意思与输入码。