登录  
 加关注
查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

博客顺风

——当思考成为习惯,成功将随之而至。

 
 
 

日志

 
 
关于我

名吴波,中国企业家世纪论坛副主席,九三学社社员,新浪微博社区委员会专家成员,打的宝拼车( dadibao.com )创新辅导员,中华诗词学会会员,扬州市政协委员,哈佛商业评论、中欧商业评论、人民网、新浪财经等专栏作家。创立全息互联网理论,出版《顺风新博客论》、《互联网帝国》、《长尾革命》。最欣赏:前秦,王猛。QQ:691382868 微信:yzwuboyz

顺风:独家全面破译百度“框计算”(一)  

2009-08-19 23:18:09|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

顺风:独家全面破译百度“框计算”(一)

口述/顺风    记录整理/秦尘

前  言:

    8月18日,在“百度技术创新大会”上,百度CEO李彦宏首次对外公布了“框计算”平台的理念和构想。该平台以百度的搜索框为核心,用户只需要输入服务需求,系统就能明确识别这种需求,并将需求分配给最优应用或内容资源提供商处理,最终返回给用户相匹配的结果。对此笔者连线著名财经作家、IT评论家、《长尾革命》作者顺风先生,请他就此发表看法。作为全息理论创始人,顺风先生已经建立一套完整的全息搜索的理论、架构、应用、模式。在这次对话中,他全面、深入的剖析百度“框计算”,并作出一些预测,在业界首次提出“智能机”的概念,这是继“上网本”之后的未来PC的重要趋势。通过这次对话,不仅为大家深刻理解百度“框计算”、未来搜索以及操作系统、PC的趋势等提供了“终南捷径”,而且也可以由此感受到顺风先生思考的广博深邃与前沿性。

顺风观点:

“框计算”是搜索的高级形态

    “框”(搜索框)这一简易入口看似简单,但其后台实际上隐藏着一系列复杂艰巨的信息处理活动,可以说“框计算”代表了一种更高级的搜索形态,其本质是智能化的新搜索。

    传统搜索的基本原理是利用被称为网络蜘蛛(Spider)的自动搜索机器人程序来连接每一个网页上的超链接而搜集信息,然后保存搜集的信息并进行整理和建立索引,最后接受用户查询并向用户输出信息。而“框计算”应具备两个基础条件:一是对用户意图的具体分析,这需要建立百度自身的局部语义网;二是后台智能化匹配,以输出相对确定和准确的答案。这两大基础条件决定了“框计算”在索引、输出、排序等方面与传统搜索模式都具有巨大的差异性。

    “框计算”的索引将发生两个转变

    第一,“框计算”的搜索从单索引向双索引转变。传统搜索以语词等基本的索引单位为基础建立简单数据的索引库,索引库数据都被细分到最终的“纳米化”水平,据以对需要处理的网页进行最彻底分析和匹配。但对“框计算”来说传统的简单数据索引库显然无法应付复杂的用户要求,因此必须建立起一种复杂数据的索引库,或者说“答案素材库”,其本质是在一次简单数据索引库基础之上的二次索引库。可见“框计算”既依赖简单数据索引,更需要复杂数据索引,这是一种复式的“双索引”结构。事实上,“框计算”已经拥有了很好的“二次索引库”基础,比如维基(wiki)知识库和在线知识问答网站,此外还有很多其他在线资源可以转换为“框计算”的二次索引库,只不过需要建立起某种转换机制和传输管道。

    第二,“框计算”的索引库建设将引入更多“人机协同”。传统搜索的服务全过程基本是机器自动完成,基本没有人工介入。当前计算机和网络明显还不具备独立完成“框计算”的用户服务任务所需要的智能条件,在这种情况下“框计算”既无法象传统搜索那种由机器独立完成任务,也不可能纯粹由人工完成任务,因此由机器和人工共同作出的综合响应便是一个现实的选择,比如“百度知道”就可能为此提供一个现成的基础机制,如果传统搜索不能给出答案这时就会有人工介入,就可以调用类似“百度知道”这样的机制。根据百度“框计算”官方网页披露的“框计算”技术架构显示,在分析用户需求时使用了语义分析、行为分析、智能人机交互、海量计算,也足以显示“框计算”是一个“人机协同”的系统。经过很多语言学、心理学等专家的多年努力,百度传统搜索中的分词技术大大增加了其核心竞争力;现在百度“人机协同”搜索系统建设答案库的过程同样需要大量复杂的人工介入,在探索“人工介入”的强度、水平、范围、环节、关键点的过程中同样会为百度积累新的竞争优势。

    “框计算”的输出和排序更加简明

    传统搜索引擎在输出时的页面“排序”往往是非常重要的一个环节,而“框计算”的输出则是确定性的若干结果,其内容组织方式呈现某种专题、课件的专门化形式,甚至直接就是寥寥数字的明确答案,不再象传统搜索那样罗列出无数网页,因此其网页“排序”的重要性就大大降低。但是这不代表“框计算”的搜索技术要求铬镍钢低了,恰恰相反的是在“框计算”的后台有着极其强大的自组织数据处理能力,能够甄别出信息的确定性、重要性、相关性、完整性等,而且对索引进行了叠加和比对处理,必须区分“或”和“且”、“是”与“否”等逻辑关系,这里有一系列复杂而庞大的运算工程。

  评论这张
 
阅读(188)| 评论(0)

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018