人民交通网-嫩草嫩草嫩草影院-人民交通杂志官网

  • 手機站
  • 微信
  • 搜索
    搜新聞
    您的位置:首頁 > 科技

    靠這個“譜”讓機器會思考

    如果說波士頓動力的翻跟頭是在幫機器人鍛煉筋骨,那么知識圖譜的“繪制”則是在試圖“創造”一個能運轉的機器人大腦。

    “目前,還不能做到讓機器理解人的語言。”中國科學院軟件所研究員、中國中文信息學會副理事長孫樂說。無論是能逗你一樂的Siri,還是會做詩的小冰,亦或是會“懸絲診脈”的沃森,它們并不真正明白自己在做什么、為什么這么做。

    讓機器學會思考,要靠“譜”。這個“譜”被稱為知識圖譜,意在將人類世界中產生的知識,構建在機器世界中,進而形成能夠支撐類腦推理的知識庫。

    為了在國內構建一個關于知識圖譜的全新產學合作模式,知識圖譜研討會日前召開,來自高校院所的研究人員與產業團隊共商打造全球化的知識圖譜體系,建立世界領先的人工智能基礎設施的開拓性工作。

    技術原理:把文本轉化成知識

    “對于‘姚明是上海人’這樣一個句子,存儲在機器里只是一串字符。而這串字符在人腦中卻是‘活’起來的。”孫樂舉例說。比如說到“姚明”,人會想到他是前美職籃球員、“小巨人”、中鋒等,而“上海”會讓人想到東方明珠、繁華都市等含義。但對于機器來說,僅僅說“姚明是上海人”,它不能和人類一樣明白其背后的含義。機器理解文本,首先就需要了解背景知識。

    那如何將文本轉化成知識呢?

    “借助信息抽取技術,人們可以從文本中抽取知識,這也正是知識圖譜構建的核心技術。”孫樂說,目前比較流行的是使用“三元組”的存儲方式。三元組由兩個點、一條邊構成,點代表實體或者概念,邊代表實體與概念之間的各種語義關系。一個點可以延伸出多個邊,構成很多關系。例如姚明這個點,可以和上海構成出生地的關系,可以和美職籃構成效力關系,還可以和2.26米構成身高關系。

    “如果這些關系足夠完善,機器就具備了理解語言的基礎。”孫樂說。那么如何讓機器擁有這樣的“理解力”呢?

    “上世紀六十年代,人工智能先驅麻省理工學院的馬文·明斯基在一個問答系統項目SIR中,使用了實體間語義關系來表示問句和答案的語義,劍橋語言研究部門的瑪格麗特·瑪斯特曼在1961年使用Semantic Network來建模世界知識,這些都可被看作是知識圖譜的前身。”孫樂說。

    隨后的Wordnet、中國的知網(Hownet)也進行了人工構建知識庫的工作。

    “這里包括主觀知識,比如社交網站上人們對某個產品的態度是喜歡還是不喜歡;場景知識,比如在某個特定場景中應該怎么做;語言知識,例如各種語言語法;常識知識,例如水、貓、狗,教人認的時候可以直接指著教,卻很難讓計算機明白。”孫樂解釋,從這些初步的分類中就能感受到知識的海量,更別說那些高層次的科學知識了。

    構建方式:從手工勞動到自動抽取

    “2010年之后,維基百科開始嘗試‘眾包’的方式,每個人都能夠貢獻知識。”孫樂說,這讓知識圖譜的積累速度大大增加,后續百度百科、互動百科等也采取了類似的知識搜集方式,發動公眾使得“積沙”這個環節的時間大大縮短、效率大大增加,無數的知識從四面八方趕來,迅速集聚,只待“成塔”。

    面對如此大量的數據,或者說“文本”,知識圖譜的構建工作自然不能再手工勞動,“讓機器自動抽取結構化的知識,自動生成‘三元組’。”孫樂說,學術界和產業界開發出了不同的構架、體系,能夠自動或半自動地從文本中生成機器可識別的知識。

    孫樂的演示課件中,有一張生動的圖畫,一大摞文件紙吃進去,電腦馬上轉化為“知識”,但事實遠沒有那么簡單。自動抽取結構化數據在不同行業還沒有統一的方案。在“百度知識圖譜”的介紹中這樣寫道:對提交至知識圖譜的數據轉換為遵循Schema的實體對象,并進行統一的數據清洗、對齊、融合、關聯等知識計算,完成圖譜的構建。“但是大家發現,基于維基百科,結構化半結構化數據挖掘出來的知識圖譜還是不夠,因此目前所有的工作都集中在研究如何從海量文本中抽取知識。”孫樂說,例如谷歌的Knowledge Vault,以及美國國家標準與技術研究院主辦的TAC-KBP評測,也都在推進從文本中抽取知識的技術。

    在權威的“知識庫自動構建國際評測”中,從文本中抽取知識被分解為實體發現、關系抽取、事件抽取、情感抽取等4部分。在美國NIST組織的TAC-KBP中文評測中,中科院軟件所—搜狗聯合團隊獲得綜合性能指標第3名,事件抽取單項指標第1名的好成績。

    “我國在這一領域可以和國際水平比肩。”孫樂介紹,中科院軟件所提出了基于Co-Bootstrapping的實體獲取算法,基于多源知識監督的關系抽取算法等,大幅度降低了文本知識抽取工具構建模型的成本,并提升了性能。

    終極目標:將人類知識全部結構化

    《圣經·舊約》記載,人類聯合起來興建希望能通往天堂的高塔——“巴別塔”,而今,創造AI的人類正在建造這樣一座“巴別塔”,幫助人工智能企及人類智能。

    自動的做法讓知識量開始形成規模,達到了能夠支持實際應用的量級。“但是這種轉化,還遠遠未達到人類的知識水平。”孫樂說,何況人類的知識一直在增加、更新,一直在動態變化,理解也應該與時俱進地體現在機器“腦”中。

    “因此知識圖譜不會是一個靜止的狀態,而是要形成一個循環,這也是美國卡耐基梅隆大學等地方提出來的Never Ending Learning(學無止境)的概念。”孫樂說。

    資料顯示,目前谷歌知識圖譜中記載了超過35億事實;Freebase中記載了4000多萬實體,上萬個屬性關系,24億多個事實;百度百科記錄詞條數1000萬個,百度搜索中應用了聯想搜索功能。

    “在醫學領域、人物關系等特定領域,也有專門的知識圖譜。”孫樂介紹,Kinships描述人物之間的親屬關系,104個實體,26種關系,10800個事實;UMLS在醫學領域描述了醫學概念之間的聯系,135個實體,49種關系,6800個事實。

    “這是一幅充滿美好前景的宏偉藍圖。”孫樂說,知識圖譜的最終目標是將人類的知識全部形式化、結構化,并用于構建基于知識的自然語言理解系統。

    盡管令業內滿意的“真正理解語言的系統”還遠未出現,目前的“巴別塔”還只是在基礎層面,但相關的應用已經顯示出廣闊的前景。例如,在百度百科輸入“冷凍電鏡”,右豎條的關聯將出現“施一公”,輸入“撒幣”,將直接在搜索項中出現“王思聰”等相關項。其中蘊含著機器對人類意圖的理解。

    “知識圖譜的應用涉及到眾多行業,尤其是知識密集型行業,目前關注度比較高的領域:醫療、金融、法律、電商、智能家電等。”孫樂介紹,基于信息、知識和智能形成的閉環,從信息中獲取知識,基于知識開發智能應用,智能應用產生新的信息,從新的信息中再獲取新的知識,不斷迭代,就可以不斷產生更加豐富的知識圖譜,更加智能的應用。

    (新媒體責編:wb001)

    聲明:

    1、凡本網注明“人民交通雜志”/人民交通網,所有自采新聞(含圖片),如需授權轉載應在授權范圍內使用,并注明來源。

    2、部分內容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。

    3、如因作品內容、版權和其他問題需要同本網聯系的,請在30日內進行。電話:010-67683008

    時政 | 交通 | 交警 | 公路 | 鐵路 | 民航 | 物流 | 水運 | 汽車 | 財經 | 輿情 | 郵局

    人民交通24小時值班手機:17801261553 商務合作:010-67683008轉602

    Copyright 人民交通雜志 All Rights Reserved 版權所有 復制必究 百度統計 地址:北京市豐臺區南三環東路6號A座四層

    增值電信業務經營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務所 李大偉

    京公網安備 11010602130064號 京ICP備18014261號-2  廣播電視節目制作經營許可證:(京)字第16597號

    主站蜘蛛池模板: 皮带清扫器-皮带聚氨酯合金空段输送带清扫器刮刀厂家-衡水格锐特机械科技有限公司 | 增压泵-离心泵-管道泵-排污泵-上海渤泉泵业制造有限公司 【官方网站】 | 山西档案架,智能档案密集架,手摇密集架,山西密集架厂家批发/报价 | 芜湖市皖创管业有限公司| 生物安全柜检测,GMP设备确认,仪器性能确认,洁净厂房检测,仓储温湿度检测-上海熙迈 | 上海山田机械有限公司| 气相色谱仪生产厂家批发价格找上海惠分科学分析仪器有限公司 | 推荐|广佛一条龙高端茶到底有多香 | 首页_01精密设备吊装,气垫搬运,半导体设备安装_苏州大方起重吊装公司 | 金酱酒_金酱酒代理加盟招商_OEM贴牌企业定制! – 金酱酒代理加盟!茅台镇较早的酿酒烧坊,年产优质酱香白酒5000余吨,仁怀市十强白酒企业,主营主品:金酱酒、金酱陈香酒、酱香老酒等系列品牌产品 | 无尘投料站-真空上料机-旋振筛|超声波振动筛|摇摆筛|筛分机-新乡市欧霖佳机械有限公司 | 浙江中凯科技股份有限公司-KB0控制与保护开关_KBO | 聊城市城乡规划设计研究院官方网站 | 天津市力豹润滑科技有限公司 | 江门市东信科技 - 江门小程序开发,江门网站制作,江门软件开发,江门app开发 | 饲料设备_饲料加工设备_饲料成套加工设备专业提供商-河南杰昌机械设备有限公司 | 形创(CREAFORM)3D扫描仪|三维检测|三维数字化处理|3D设备租赁|3D打印|——北京中显恒业仪器仪表有限公司 | 新闻营销媒体发稿-新闻发布-文芳阁网络媒体发稿公司 | 液压尾管悬挂器,机械式尾管悬挂器价格,石油套管扶正器厂家,连续油管悬挂器,高压双塞水泥头,免钻塞注水泥分级箍,单塞套管水泥头价格,弹性套管扶正器,铸铝钢性扶正器,钢性套管扶正器厂家 | 鲜淘网 - 精选全球水果蔬菜肉食海产生鲜,酒水食品零食加盟供求信息 | 乌鲁木齐万疆通管道设备有限公司 销售热线;13565955557-新疆 乌鲁木齐 万疆通 管道设备 波纹补偿器 膨胀节 金属软管 伸缩器 管件 阀门 维修 | 四川超声波清洗机厂家-旋转喷淋清洗机设备-成都鑫荣诚超声波科技有限公司 | 烟台废旧物资回收,烟台废品回收,烟台物资回收-烟台金泰再生资源有限公司 | 久久黄色一级视频_视频一区精品自拍_理论片免费ā片在线观看_亚洲色视频在线播放网站_香港经典a毛片免费观看_亚州三级久久电影 | 呼吸家官网|肺功能检测仪生产厂家|国产肺功能仪知名品牌|肺功能检测仪|肺功能测试仪|婴幼儿肺功能仪|弥散残气肺功能仪|肺功能测试系统|广州红象医疗科技有限公司|便携式肺功能仪|大肺功能仪|呼吸康复一体机|儿童肺功能仪|肺活量计|医用简易肺功能仪|呼吸康复系统|肺功能仪|弥散肺功能仪(大肺)|便携式肺功能检测仪|肺康复|呼吸肌力测定肺功能仪|肺功能测定仪|呼吸神经肌肉刺激仪|便携式肺功能 | 新密耐火材料厂家价格-河南郑州荣盛窑炉耐火材料有限公司 | 乌海市腐植酸盐加工,内蒙古腐植酸钠,内蒙古型煤粘合剂生产厂家|创联腐植酸盐加工有限公司 | 展馆展厅设计_数字多媒体展厅_3D全息投影_三维动画制作_企业宣传片|深圳市华南数字科技有限公司 斩天手游网_高质量手机游戏下载中心 | 四方光电(武汉)仪器有限公司_四方仪器首页-烟气分析仪|尾气分析仪|煤气分析仪|沼气分析仪|天然气分析仪|超声波流量计|在线气体分析系统|红外气体传感器 | 喷涂陶瓷涂层_热喷涂陶瓷涂层-北京耐默公司 | 友联智能|RFID应用服务供应商|专注RFID行业解决方案|RFID数据采集-助力行业数字化转型 | 长沙变频器维修,变频器维修,ABB变频器维修,西门子变频器维修,施耐德变频器维修,伺服驱动器维修,工业机器人维修,20年专业工控电气维修,长沙文铖电气设备有限公司_长沙文铖电气设备有限公司 | 润东方环保空调厂家-水冷式空调价格-润东方水冷空调-东莞市科骏机电设备有限公司 | 山东自保温砌块_泰安自保温砌块厂家_山东润德新型建材有限公司【网站】 | 罗茨鼓风机价格_三叶罗茨鼓风机厂家-山东锦工有限公司 | 新乡市矿山起重机制造有限公司| 江苏保捷锻压有限公司(中国汽车零部件供应商,锻造,精加工,热处理) | 赛车微信群二维码平台下载【找群网zhaoqun5.com】 | 螺带混合机|卧式螺带混合机|双动力混合机-无锡鑫海干燥粉体设备有限公司 | 湖北高新技术企业认定申报|武汉高企认定代办|武汉项目申报首选 - 湖北创优企科技服务有限公司 | 潍坊网络推广,临沂360推广,东营360推广,枣庄360推广,潍坊网站建设,潍坊网络公司,潍坊360搜索,潍坊APP开发,潍坊360推广,潍坊360代理,潍坊点睛网络科技有限公司 |