90 后技术宅与他的非主流另类搜索引擎 Magi

威锋网 22天前 ⋅ 35 阅读

最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。确实,这个页面看着就很让人舒爽。

重要的是搜索结果也很不一般,属性中的每一个结果有对应的链接,并带有标签和主要学习来源部分,搜索结果以结构化知识的形式呈现。这种模式和国内外主流的搜索引擎完全不一样,让人感觉新鲜。当然,也让人由此发出疑问:Magi 到底是什么,是谁开发的,好不好用?

按照开发者 PeakJi 季逸超的讲述和 Magi 网站上的说明,Magi 其实并不是单纯的网页搜索引擎,而是自主阅读文本并持续纠错的 AI。

Magi 是由 Peak Labs 从无到有自研的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。

11 月,Peak Labs 发布了公众版 Magi.com。与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。此外,Magi 从零研发了一套互联网搜索引擎,所以 Magi.com 同时提供全网规模的普通搜索结果,学习过程是在无人干预的情况下 7 x 24 小时不间断运行。

互联网数据浩如烟海,质量参差不齐,如何将这些数据处理成机器能够理解的数据结构时隔巨大的挑战。

在「Magi 的使命」一项中,Peak Labs 这样写道:作为公众版本的 magi.com 为人类用户提供了与互联网数据交互的新方式,而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。

对 Magi 的技术感兴趣的同学,可以访问 www.peak-labs.com 官网和季逸超的知乎,我们在这里就不多说了。下面来关注一下 Magi 背后的团队—— Peak Labs,以及创始人 PeakJi 。

创始人 PeakJi 真名季逸超,90 后男生,在北大附中读高中期间接触 iOS 并加入威锋网 WEIP 技术组,先后参与了 wefit 输入法的完善和各种越狱研究,高三设计并开发猛犸 1 网页浏览器,大一推出猛犸 4。据说,PeakJi 所有的产品都是由他独自完成设计、美工、算法、编码、测试和推广,可见啊这是一个非常有想法,动手能力也很强的「技术宅」了。

2012 年,在北大念书的季逸超创建 Peak Labs,并发明了 Rasgueado 输入法。

据说 Peak Labs 的产品和技术还有很多,什么神经信息提取系统 Ireul,网页大规模搜索引擎 Ramiel,多语言分析 pipeline Arael 和分布式检索系统 Matarael 等等,利用这些技术构架,他们搭建了 Magi 服务,包括普惠版和企业版两种。

如果你要问 Magi 好不好用,我们暂时也无法给出明确回答,因为 Magi 目前完成度还有待提高。但是,比起当做搜索引擎来用,Magi 应该更适合做知识学习链库。

在使用的过程,我们会发现 Magi 也有很多不足之处,尤其是在搜索规模和答案准确度上。面对一些简单搜索,Magi 往往给不出让人满意的答案,而且速度也不够快。

另外,它不是一款搜索引擎,像搜索网址这类任务也达不到很好的效果,也无法进行图片搜索。对于 Magi 的缺点,团队和 PeakJi 都大方坦诚。

Peak Labs 指出,Magi 已经展示出的开放领域信息提取能力,可以应用到企业客户所在的细分领域内,变成一个更加强大的信息抽取系统,让每一个领域、每一家企业都可以轻松地打造属于自己的知识图谱,他们希望未来的 Magi 系统能够成为「知识领域的 ImageNet」。

Magi 现在还远算不上成熟,但其特性决定了它无穷的可能性和成长空间。未来,也许 Magi 会成为打破现有搜索引擎原理的新范式,开启全新的结构化知识搜索引擎时代,改变我们对信息检索和知识获取方式的刻板印象,毕竟在信息大革命和人工智能大发展的时代,千帆竞速,百舸争流,谁都有机会。


全部评论: 0

    我有话说: