币核E姐有约|开阔AI的认知,EpiK Protocol如何构建人类永恒知识库
4月27日,第20期「霍比特E姐有约」线上AMA,邀请到了EpiK Protocol的中国区负责人Eric?Yao,围绕主题「开阔AI的认知,EpiK Protocol如何构建人类永恒知识库」,为社区用户带来了EpiK Protocol项目的深度分享。
项目简介:
EpiK Protocol是一个去中心化的知识图谱协作平台,通过可信存储、可信激励、可信治理和可信金融,组织全球知识社区用户共同协作,将人类各领域知识转化为知识图谱永久保存,开阔 AI 的认知。
以下为AMA内容实录:
Elsa:EpiK Protocol在4月22日正式上线了霍比特HBTC,与此同时「交易EPK,瓜分8,500个EPK」、「幸运锦鲤瓜分1,500个EPK」两大活动正在火热进行中,为了让大家对项目有一个更深的了解,今天我们特地邀请到EpiK Protocol中国区负责人Eric Yao,来给大家带来“去中心化的知识图谱协作平台——EpiK Protocol”的深度分享。
Elsa:请Eric给大家介绍下Epik项目以及项目团队
Eric:大家好!我是EpiK中国区负责人Eric。很高兴与大家共同探讨EpiK未来发展。首先,我要向大家介绍下,我们正在做的事情。相信屏幕前的各位不少人都看过黑客帝国,母体之所以不断让人能够有意识,可以大胆猜测背后一定有一个不会拔掉网线就彻底失去联系的知识图谱库。铭识协议目标就是致力于借助区块链技术打造一个去中心化的共建共享共益的安全可信知识图谱协作平台,以极低的管理成本组织全球知识社区用户共同协作,将人类各领域知识转化为知识图谱永久保存,开阔?AI 的认知,推动认知智能时代的到来。同时EpiK也是全球首个区块链+知识图谱平台。我们的项目团队主要由来自清华大学等高校、研究机构的专家学者、知名区块链、知识图谱、大数据公司、互联网巨头高管组成,有着专业视角以及深厚的领域经验。
Elsa:EpiK的知识图谱与互联网巨头知识图谱有何不同?
Eric:最大的不同,一个是中心化控制,而另一个是去中心化开放生态。底层的技术生态的开放是一个趋势,这几天,华为开发者大会的召开就代表着这种趋势,开放的生态将带来更快的增长。这在知识图谱这件事上体现的比较突出。
将人类以各种形式传承的知识转变为一个超大规模的高质量知识图谱并非易事,面临诸多挑战。首先,人类知识涉及的专业领域之广之深,远非一个组织、一家公司甚至一个国家能完全独立掌握。其次,在知识图谱构建过程中,包括采集、提取、消歧和融合等多个需要人工参与的环节,这意味着每个专业领域的知识图谱构建都成本不低。最后,也是最为棘手的问题是,由于知识图谱构建成本高,大多数人无法独自构建,这就意味着很多AI需要使用第三方提供的知识图谱来构建认知能力, 如果这些被依赖的第三方知识图谱数据被恶意篡改了,将直接导致众多 AI 的认知紊乱,进而失控。
因此一个不受中心化控制、能激励各方力量参与共建、数据安全可信防篡改的知识图谱数据库显得必不可少。
同时EPIK通过共建共享生成知识库的方式,不但收集数据的成本更低,同时一次生成,多次共享。对外提供数据服务数据使用成本也更低。
Elsa:EpiK近来获得了战略轮融资,资本垂青是来源于EpiK很多价值点,其中之一就是存储,EpiK与IPFS、Filecoin有哪些不同?又有哪些联系?
Eric:EpiK是Filecoin生态项目。EpiK集成Filecoin去中心化存储技术成果,搭建二层网络,并随着Filecoin发展而不断水涨船高。同时,当前数据价值备受瞩目,
有效数据是Filecoin尚未被挖掘的一个金矿。有效数据的权重是目前垃圾数据的10倍,相应收益也是10倍。EpiK给Filecoin生态提供有效数据,参与EpiK布局就是布局Filecoin生态中有效数据的金矿。
EpiK为矿工群体提供良好的收益环境。EpiK 铭识协议对于矿机的要求不高,目前测试网标准配置 8 核 16g,250g ssd。目前市面上大部分的 IPFS 矿机都足够可以参加,而个价格只需要filecoin矿机的百分之一。
另外,不同于Filecoin,EpiK对矿工接入门槛以及惩罚机制较为宽松,对矿工更为友好,在Filecoin与AI前景加持下,EpiK受到矿工们广泛认可。
Elsa:目前有没有参与到的具体实施的项目?如果有,还请给大家介绍一下,具体做了哪些工作?
Eric:目前EpiK与多个生态展开协作。就以清华110周年校庆上,EpiK参与展出的由EpiK支持的应用健康链项目。该项目是清华大学信息科学技术学院与多家机构一起合作的应用项目,EpiK主要负责基础设施构建,即数据加工、数据标注,数据监管,与数据提供以及数据利用,为健康链应用奠定坚实基础。
当前EpiK团队聚焦点在于构建去中心化的协作闭环,让各个领域的知识图谱都能在这样的协作网络中滚雪球滚起来。当然,我们需要showcase,目前我们的领域专家分布在语音、医疗、保险、法律、金融、电子游戏、乡村产业结构这几个方向,相关的题库会陆续在我们的知识大陆产品中跟大家见面。
Elsa:目前EpiK有哪些落地的产品跟大家分享?都有哪些进展?未来有哪些产品计划?
Eric:当前EpiK旗下知识图谱数据采集应用「知识大陆」已开启公测,组织全球参与者共建共建大规模开放知识图谱数据库。截止目前,知识大陆生成了59250条语音数据,吸引了694位知识采集和标注者,而且这个数据仍在不断上涨中。
当然,知识大陆仅仅是开放性知识生态的一个缩影,是EpiK生态工具产品的一个案例。为了更高效、更大规模地协作,EpiK目前也正在和多家知名数据标注公司合作,共同助力开放知识生态的构建。
Elsa:项目、产品通过您的介绍,相信大家都有了一定的了解了,那我们再聊聊项目代币EPK,Epik的经济模型是如何构建的,EPK在其中的作用有哪些?
Eric:首先参与epik生态的各个参与方都是需要一定的epk抵押来做数据和资质担保的,每台矿机需要抵押最少1K个EPK,每位领域专家都需要有10W epk的抵押投票才能当选,使用Epik上的数据也是需要按数据多少抵押一定的EPK。
在DAO生态当中的5个角色分配主网上线后每天产生的EPK。
矿工拥有其中75%的EPK,领域专家拥有其中9%的EPK,投票用户分享其中1%的EPK。另外15%的EPK将会根据网络每日访问流量浮动,而这15%的部分是矿工和领域专家相互博弈的关系。
网络活跃度的评判标准就在于全网为了获取每日访问流量而抵押进来的EPK占总流通量比重(1EPK=10Mb/天),比例越高则说明数据需求量增大,这就要求矿工提升带宽质量。如果数据需求量降低,这就要求领域专家提供更高质量的数据。
这就好比图书馆里访客多了,就需要更多的座椅,即花钱让矿工提升带宽。访客少的时候,需要更多钱购买更优质的书籍吸引访客,即给赏金猎人和领域专家去生成更多优质知识图谱数据。
不同于Filecoin生态中官方和大矿工的博弈,数据的生产方和数据的存储方的博弈是生态中最重要的博弈关系。
在社区治理方面我们会进行社区分层治理,系统层人人持币投票参与治理,存储层矿工按算力投票参与治理,知识层领域专家一人一票参与治理,不同的参数仅有利益相关方参与治理,避免治理泛化,效率低下。
Elsa:矿工、领域专家、赏金猎人和知识网关、用户这几个角色如何参与到EpiK生态系统中去?
Eric:EpiK生态机制中共有4个角色,领域专家,赏金猎人,知识网关和知识矿工,其中领域专家是知识图谱数据的组织者和验收员,也是整个系统中唯一有权利上传知识图谱数据?的群体,他们通过贡献高品质的知识图谱数据获得收益。当然,作为全系统唯一有数据上传权利的群体,对于领域专家有着严格的监督机制。首先,领域专家必须由已经是领域专家的人提名产生,提名后的领域专家还需要在社区中获得社区投票的支持,每一票都意味着一个?EPK 被锁定。一旦领域专家票数(锁仓?EPK 数)少于最小阈值,则失去资格。如果领域专家上传的虚假、垃圾的数据,社区讲给予除名处罚,提名了被除名领域专家的人也将受到连带惩罚。知识图谱数据生成任务是繁重的,领域专家难以独立完成,所以系统内还设计了赏金猎人角色,他们是知识图谱数据的采集员和标注员,他们通过完成领域专家发布的各种任务来获得收益。另外,还有知识矿工和知识网关两个核心角色。知识矿工是知识图谱数据的存储和带宽设备提供者,通过提供数据存储和数据访问服务来获得收益。存储的数据越多,收益越高;提供的数据下载流量越大,收益也越高。与此同时,为了预防数据矿工随意下线导致数据备份减少,系统安全性下降,所有数据矿工都需要抵押一部分 EPK 才能成为数据矿工。知识网关是用户获取最新第一手知识图谱数据的唯一途径,知识网关需要抵押 EPK 来获得数据访问流量。那么对于 EpiK 上知识图谱数据的需求越多,知识网关们抵押的 EPK 就会越多,EPK 的需求会增加,贡献者们获得的 EPK 就会越有价值。
他们之间的协作关系也更明确,用户票选出的领域专家梳理各类知识图谱,向赏金猎人分配任务,赏金猎人通过完成标注任务获取奖励,而经过领域专家检验上传知识图谱数据到链上,由矿工进行存储,而用户则可以通过网关获取知识图谱,从而实现知识图谱梳理、标注、存储与应用的自动化协作流程。
Elsa:Epk是如何EpiK知识生态系统中获得价值,生态系统如何才能获得持续增长?
Eric:在大方向上来看Epik的代币价值取决于他所处的数据存储领域和经济模型,链上高价值的数据自身就带有非常强的商业化价值,你要使用已经整理好的知识图谱就需要一定量的EPK做抵押。
事实上,知识图谱在互联网行业早就被广泛使用,百度的搜索、美团的外卖、头条的推荐等等大厂的核心产品,背后都有大量知识图谱的应用。现在知识图谱数据的需求方在长期的业务运营中积累了大量数据,但这些数据尚未被良好地挖掘价值,知识图谱化这些数据能帮助他们将业务知识传授给人工智能算法,不仅能辅助他们更智能地进行商业决策,而且能提升用户体验和运营成本。
因此,EpiK也是试图不断地去落地更多的领域知识图谱的搭建,实现商用价值如体检数据知识图谱化能帮助用户生成智能体检报告,保险数据知识图谱化能帮助用户智能选保投保,各城镇产业结构数据图谱化能帮助我们更好地挖掘家乡创业机会等等。
Elsa:在EpiK生态系统中还融入DeFi的功能,具体又是怎么考虑的呢?
Eric:数字货币发展至今,头部效应明显,大部分用户都持有着诸如 BTC/ETH 这类的主流币种。为了帮助这些用户也能顺滑地参与到去中心化知识图谱生态的协作中来,我们在铭识协议之上为其提供了去中心化借贷服务,比如一个用户持有主流币BTC资产,他需要使用epk来访问知识库数据或者发起投票,他可以通过铭识协议的跨链网关将 BTC兑换成 eBTC,然后通过铭识协议的借贷服务超额抵押 eBTC 借出 EPK ,然后抵押 EPK 成为矿工挖矿 EPK,或者票选自己成为领域专家获得持续性 EPK 奖励,或者抵押 EPK 下载所需的知识图谱数据。等有一天想退出知识图谱协作网络时,将抵押的 EPK 取出,在铭识协议借贷服务里归还 EPK 取回之前超额抵押的 eBTC, 然后通过跨链网关跨出拿回原生BTC。
Elsa:EpiK未来有哪些规划?
Eric:目前第一阶段的产品,主链?v1.0、主网钱包、主网浏览器、知识采集App知识大陆都已开发完成进入内测,首批领域专家也在积极招募中,待审计结束后,我们将择日上线。并开始第二阶段的生态建设,核心产品包括集成EVM的主链2.0和知识采集开放平台,还会包括一系列领域知识图谱的小应用会在下个阶段跟大家见面。
社区提问:
1、创立Epik过程中遇到的最大挑战是什么?针对国内市场有没有哪些特别的布局?
答:EpiK是国内首个集成去中心化技术与AI知识图谱的项目。我们遇到的最大困难就是如何打通这两个彼此相对独立的领域。去中心化技术IPFS于去年年初成熟,EpiK项目也诞生于去年年中,就是基于该技术的成熟,我们认为终于能有效赋能AI知识图谱后才开始做的。建立一个共建共享公开的知识图谱需要打破现在已有的行业内数据孤岛问题,当前数据巨头们各自持有内部的数据库与知识图谱库,既造成严重的数据孤岛也令中小型数据公司的研发之路寸步难行。我们相信,唯有建立一个去中心化的公开知识图谱库才能更好地赋能当下的 AI 产业。
在与各大数据公司达成协作的路途上,也是我们的冷启动阶段,是非常挑战的。然而如今我们可以比较自豪地说,辛勤还是换来了收获,就像刚刚提到的,不少国内及海外公司都开始向我们抛来了橄榄枝,EpiK知识生态正在逐步完善中。
2、感觉是大数据与区块链的结合,那么各个知识应用之间会打通吗?
答:当前我们的第一版知识众包产品「知识大陆」是基于游戏化众包概念的数据标注App,其主要针对语音采集、语音数据的标注,这也是我们和清华大学大数据研究院合作的一个项目,为共同打造国内最大的声纹识别库。
而在我们的EpiK知识主网上,将接入各垂直行业的底层知识图谱数据库,同时生态用户将通过抵押EPK进行读数据。而赏金猎人领域专家角色则可以进行任务的采集,进行数据标注以提供更多数据来得到EPK,这里又有数据标注的存在了。可以说知识图谱与数据标注是分不开的,相辅相成的。因而我们的各大知识生态小应用将是围绕EpiK知识图谱主网建立的。
另外补充一点哈,当前知识大陆APP已支持注册国家为英国、美国、德国、加拿大、巴西、日本、韩国、越南。我们陆续接到更多国家的需求,如瑞士、俄罗斯、印度、巴基斯坦、印度尼西亚等。与此同时,我们与高校的合作较为密集,同时与应用型公司的合作也在持续推进中。
3、EpiK怎么保障数据安全的?准备了什么措施,如果出现了信息泄露有什么应急方案?
答:实际上传链上的并不是数据本身,而是经过数据标注后的知识图谱小日志文件。知识图谱本质上是通过语义关系将不同的实体之间进行相联系,以让机器能理解人类世界的语言。所以我们并不会上传以及公开企业的真实应用数据,会在进行脱敏操作的同时,将其加工为知识图谱数据后上传。
另外,各行业之间的知识图谱是有差异的,比如医疗和教育就是很不一样的。但同行业的知识图谱是相通的。所以共享知识图谱 schema 对于企业本身是没有威胁的。然而困难的是,这个知识图谱架构的得来需要耗费大规模的人力和财力去购买数据及标注服务,因此企业在得到以后是不愿意进行共享公开的。
所以我们希望建立的共建知识图谱开放平台,以解决没有这个实力但仍然想进行 AI 探索的中小型公司的知识图谱搭建需求。
4、EPK在社区建设特别是海外社区建设方面有什么计划?
答:目前在国内, 去中心化数据市场方面的探索并不是很多,然而事实上在国际上,数据市场、数据资产化是非常热门的话题。在欧洲,因为GDPR数据隐私保护法,人们十分关注自己的数据安全,数据主权,因而相关的数据项目非常多。
同时在美国、印度等,有相当多的企业与个人从事数据标注行业,既因为人工智能行业的蓬勃发展,也因为在这些地区,对于会使用计算机又没有太高文化水平的人来说,数据标注是非常完美的职业。
这也是其非常适合作为众包来发展的原因之一,人们只要学习基础的标注知识,就能进行工作,多劳多得。目前,我们已于国内外标注企业都取得联系,为了更好地对接未来的知识生态。
5、目前代币EPK是0.4USDT,是否被低估了,你觉得这个市场项目与哪些因素有关?
答:对于EpiK目前的发展阶段来说,可以说这个价格是合理的,原因如下:
1.EpiK的主网尚未上线,对于EpiK质押挖矿,每台矿机对应1100 EPK左右,在主网尚未开始的时候,市场价相对低下也有利于矿工生态的发展,不至于中心化大矿场垄断;
2.EpiK的产品也才刚上线不久,虽然参加者们都很热情,然而语音数据库也正在搭建中,所以咱们从传统互联网产品的角度理解的话,可以说仍是项目早期阶段,尚未有产品和数据,那么对应现在的4000w流通量,0.4USDT的价格,是1600w的估值是合理的。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。