人民交通网-嫩草嫩草嫩草影院-人民交通杂志官网

  • 手機站
  • 微信
  • 搜索
    搜新聞
    您的位置:首頁 > 科技

    遷移學習:教AI提取抽象知識

    昂貴、罕見、難駕馭、有破壞性,人生哪有一帆風順,人工智能的“一生”也會遇到很多難以進行“訓練”的場景,也就是靠大量常規數據無法訓練的場景。

    就好像拍電影,要拍《少年派的奇幻漂流》,需要一只老虎做演員,怎么辦?買好多只這種珍稀動物,讓馴獸師教它演戲,到最后還任憑它因劇情需要而死去?

    這肯定不行。于是李安讓特技團隊“造”出一只相似度99%的虛擬虎,昂貴、罕見、難駕馭、有破壞性的難題迎刃而解,而以此為代表作品的虛擬場景構建技術也成為遷移學習的一種方法。

    日前,有媒體轉載《日本經濟新聞》報道,日本在人工智能“遷移學習”研究方面取得進步。日本東北大學將遷移學習應用在模仿語氣的對話系統上,松下公司將其應用在了判定特定人群病情的軟件上,被視作加速人工智能應用落地的研究進展。

    AI的學習為什么要遷移,又如何遷移?它如何讓AI更智慧?科技日報記者1月3日專訪了北京語言大學教授荀恩東、智能一點公司CTO莫瑜等行業專家,聽聽他們的解讀。

    舉一反三:用一般數據解決特殊問題

    “有些模型的識別率已經超過了人的識別率。”荀恩東說,人們越來越擅長訓練深度神經網絡,但是高準確率是建立在現實情況與訓練情況相吻合的基礎上,即實戰與演習相一致。

    如果是預設之外,就很難達到預期的識別準確率。“機器有機器的預設之外。”荀恩東以聲音識別為例告訴記者:比如太濃的口音、太大的背景噪音等,這些和人的“困難場景”一致,但是機器還會受到遠場噪音的影響,“例如太空曠的地方,會有回音,影響識別”。

    那是不是每遇到一個特殊場景,都要重新建模,輸入大量的樣本讓機器重新學習一次呢?答案當然是否定的。

    因為我們首先要考慮成本因素,這就是文章開頭提到的“昂貴、有破壞性”特點。其次就是“難駕馭”的問題了——即使我們能不惜成本地反復建模、學習新樣本,但有些特殊場景的樣本很罕見,或者無法控制其能產生的成本,也就無法達到組成訓練集的要求。比如《日本經濟新聞》報道的,有些罕見病的診斷分析案例只有幾十件,這種情況下,如何讓人工智能擁有判斷的能力?

    “現實世界真混亂啊”,當AI從模型訓練來到“塵世”,它可能會有這樣的慨嘆,大量的全新場景涌過來,“生搬硬套”根本使不上。

    成功的模型目前仍然極度依賴數據,但能夠獲得大量可用數據的情況卻因領域不同,而分布極度不均。資料顯示,目前少數數據是公開的,還有不少數據是有專利的,或者購買起來很昂貴,剩下更多領域的數據是無法獲得或者沒有積累的。也就是說,AI的“訓練題庫”完全無法覆蓋“考試題庫”。

    為了解決新的任務,“遷移學習”成為人們希望人工智能擁有的能力。“要能用一般的數據解決特殊的問題,用易獲得的數據解決難收集數據的問題。”北京語言大學教授荀恩東說,它能拓展人工智能的實際應用范圍。

    “就是舉一反三的能力,”莫瑜解釋,比如,要讓機器在識別貓之后很容易識別狗,就需要構建一個識別貓的模型,包含一些特征,例如尾巴、腿、胡須等,這些特征在識別狗的時候可以被機器利用上。

    說起來很簡單,但這意味著神經網絡有能力存儲并提取“概念性”的東西,也就是存儲和提取抽象的知識,而“不局限于給數據、出結果這種端對端的輸入輸出”,荀恩東說。

    眼花繚亂:不同領域需要不同策略

    “數據層面、特征層面、模型層面的內容都可以進行遷移。”荀恩東說,遷移學習并不是某個固定的算法或者具體的技術,更多地是一種解決問題的策略。

    遷移學習之前被稱為自適應學習。它的初衷是節約人工標注樣本的時間,讓模型可以通過已有的標簽數據向未標簽數據遷移。“某個特定模型里的標簽數據是機器能夠識別的,機器根據標簽來捕捉識別特點,如果成功將模型遷移至未標簽數據,那么這些數據不用重新建模就可以使用。”荀恩東說。

    遷移學習具體怎么做呢?

    “遷移學習就是開發一系列如何遷移的算法。”莫瑜解釋,怎么讓在一個領域工作的算法在少量新數據的情況下可以應用到新的領域?例如,可能存在一種算法,不需要改造,在聽懂普通話的AI開發出來之后,直接就能聽懂廣東話。“一般機器學習算法研究如何解決問題,而遷移學習要創造遷移算法,實現從一個領域的問題解決方案遷移到另一個相似領域。”據稱,在過去20年中,科學家積累了上百種遷移學習的算法。

    隨著研究的深入,遷移學習的策略越來越多,也取得了不小的進展。第四范式首席科學家楊強曾在一次演講中介紹,將機器學習的目標問題“打散”,即把問題的結構和內容分離開,會發現不同問題之間的共性。一篇發表在《科學》雜志上的文章顯示,將手寫字體識別上的結構和手寫方式區分開之后,結構的學習采用單個數據就能訓練。此外,層次化的系統更容易幫助構建機器學習的遷移;分階段地從已訓練領域到新領域的多步傳導式遷移也被證明是適用的策略。

    可見,“遷移大法”的原則是在實現由A領域向B領域的遷移時,盡量“平滑”地推動——兩個域的表征要盡可能相似,或者通過一些操作增加兩個域表征的相似性,甚至創建出“通用”的表征。例如ImageNet花費了多年,用數千個小時來創建,“基于ImageNet數據集的圖像識別深度神經網絡模型,經常被用來作為圖像特征抽取,應用到其他圖像任務。”莫瑜說。一篇名為《基于深度學習和遷移學習的識花實踐》的文章進行了類似“百度經驗”的分享,就是基于ImageNet數據集,示范如何將一個原來只能識別花的圖像的深度卷積網絡,遷移到識別花朵類型、具體品種的新任務上。通過“抽取圖像特征”“準備訓練集,驗證集和測試集”“訓練網絡”等步驟,這一“遷移”得到了88%的識別正確率,計算時間只用大概半小時,比完成從零開始重新建模快很多。

    歷久彌新:或成機器學習商業新驅力

    事實上,遷移學習和人工智能一樣并不是新概念,在近幾年又恢復了研究熱度。2016年,前百度首席科學家吳恩達曾表示,遷移學習將會是繼監督學習之后的下一個機器學習商業成功的驅動力。楊強也認為,機器學習的明天是在小數據、個性化、可靠性上,這取決于遷移學習的發展。

    國際巨頭也在著力于遷移學習的實踐,AlphaGo的開發團隊DeepMind在嘗試對機器人進行遷移學習的訓練。他們先從一只胳膊開始——在仿真環境中訓練一個機械臂移動,訓練好之后,把知識遷移到真實的機械臂上,真實的機械臂稍加訓練可以做到和仿真一樣的效果。

    谷歌通過仿真系統訓練無人車駕駛,然后遷移到實際駕駛中。傳授硅谷企業課程的在線大學優達學城也開源了用來進行無人駕駛汽車工程納米學位教學的模擬器,仿真更方便獲取不同類別的數據,更方便多因素并行地訓練學習。

    “我們對話機器人也有類似問題,在一個客戶上訓練的對話系統,怎么應用到新的客戶,而不用從零開始。”莫瑜說,遷移學習的應用范圍是很廣泛的。

    “遷移學習大多是在解決實際問題,AI應用層面的內容多一些,”荀恩東說,“在實踐中也有各種各樣的做法,我國在AI的應用場景開發上,還是不落人后的。”

    (新媒體責編:wb001)

    聲明:

    1、凡本網注明“人民交通雜志”/人民交通網,所有自采新聞(含圖片),如需授權轉載應在授權范圍內使用,并注明來源。

    2、部分內容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。

    3、如因作品內容、版權和其他問題需要同本網聯系的,請在30日內進行。電話:010-67683008

    時政 | 交通 | 交警 | 公路 | 鐵路 | 民航 | 物流 | 水運 | 汽車 | 財經 | 輿情 | 郵局

    人民交通24小時值班手機:17801261553 商務合作:010-67683008轉602

    Copyright 人民交通雜志 All Rights Reserved 版權所有 復制必究 百度統計 地址:北京市豐臺區南三環東路6號A座四層

    增值電信業務經營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務所 李大偉

    京公網安備 11010602130064號 京ICP備18014261號-2  廣播電視節目制作經營許可證:(京)字第16597號

    主站蜘蛛池模板: 医药冷库设计建造-食品保鲜冷库安装-物流冷库工程造价-开冉制冷 医盟网-全国首家医疗信息化行业门户网站 | 深圳彩盒印刷-纸盒包装-不干胶标签印刷-深圳印刷厂家-深圳贝的印刷 | 中国工业网_网络工业品牌 资讯创造价值 | 耐磨工业软管,PTFE耐腐蚀软管,耐磨喷砂胶管,超耐磨软管厂家,漯河利通液压管利通科技-耐磨工业软管,PTFE耐腐蚀软管,耐磨喷砂胶管,超耐磨软管厂家,漯河利通液压管利通科技 | 义乌供需网-义乌外发加工来料加工,义乌采购信息供求对接平台(yiwugongxu.com) | 仪器校准_校验_计量检测_校正_检定严选博罗第三方法定计量所 | 组合式空调机组-吊顶式新风换气机-消防高温排烟风机-德州宏楚空调设备有限公司 | 洗车机-自动汽车洗车机-全自动洗车设备-全自动电脑洗车机-北京自然绿环境科技发展有限公司 | 轴流风机_混流风机_排烟防火阀-德州辰特空调设备有限公司 | 郑州离婚律师|婚姻律师在线咨询-河南锦盾律师事务所 | 长春互联网运营值选星广传媒,长春短视频运营,长春新媒体运营,长春互联网运营,长春抖音运营,吉林视频号代运营,吉林快手代运营,短视频推广公司,公众号运营,微博运营,新媒体运营 | 智能化会议系统|多媒体会议系统|无纸化会议系统|会议音箱|高清视频会议终端|智能化会议室|会议系统|视频会议系统-深圳市航视达科技有限公司 | 数控落地镗铣床_数控刨台式镗铣床_数控龙门加工中心-青岛辉腾机械设备有限公司 | 四方光电(武汉)仪器有限公司_四方仪器首页-烟气分析仪|尾气分析仪|煤气分析仪|沼气分析仪|天然气分析仪|超声波流量计|在线气体分析系统|红外气体传感器 | 在线红外水分测控仪-SK-100水分测试仪-上海拓西电子科技有限公司 | 人仁康集团 -- 10A抗菌舱研发生产厂家| 上海眼科医院_上海希玛瑞视眼科医院【上海医保定点单位】 | 昆明护栏网厂家_隔离栅_围栏网_石笼网「13年生产经验」-云南北辛商贸 | 恒升(新乡)食品有限公司| 易居房产律师网|北京房产律师|房产纠纷律师|房产律师 | 信用卡申请_银行贷款_贷款计算器_银桥网| 宁波拓铁机械有限公司-球鉄_灰铁铸造_铸件工业退火 | 新中式家具,广东新中式家具,广州新中式家具,佛山新中式家具,顺德新中式家具,乐从新中式家具,新中式家具厂家直销--唐明雅居 | 西安木包装箱出口托盘定做价格-抽真空实木包装箱免熏蒸木箱多层板木箱哪家好-模压托盘及白松原木-西安宇森木业 | 免喷涂材料,免喷涂塑料,免喷涂注塑,免喷涂挤塑,免喷涂工艺-中山鸿盛免喷涂 | 柱塞泥浆泵|压滤机专用泵|陶瓷泥浆泵_咸阳华星泵业有限公司 | 四合扣-工字扣-帽钉(831,200,警用,大拉力四合扣)-永嘉县鑫达钮扣有限公司 | 激光切管机_等离子切管机_相贯线切管机厂家|服务为先-山东美峰智能设备有限公司 | 套丝机_钢管套丝机_螺栓套丝机S8139_螺纹钢套丝机_智能套丝机价格-瑞捷机械设备有限公司 | 上海松韬自动化设备有限公司,致力于高压清洗及工业自动化制造 | 苏州注册公司-代理工商注册-苏州及财企业服务有限公司 | 郑州月嫂|月嫂培训|月嫂服务|郑州布卢家政服务有限公司 | 柔性防水套管_刚性防水套管-河南恒生管道制造有限公司 | 立式/卧式/暖气/管道泵,管道离心泵选型,管道增压泵型号 - 安平鼎千泵业制造厂 | 金酱酒_金酱酒代理加盟招商_OEM贴牌企业定制! – 金酱酒代理加盟!茅台镇较早的酿酒烧坊,年产优质酱香白酒5000余吨,仁怀市十强白酒企业,主营主品:金酱酒、金酱陈香酒、酱香老酒等系列品牌产品 | 水上游乐设备 - 郑州亿浪水上乐园设备有限公司 | 无人叉车|智能无人叉车|智能AGV叉车|激光叉车AGV厂家_江西丹巴赫机器人股份有限公司 | 万博瑞升(天津)科技有限公司-管道应力|管道振动|脉动|CAE,CFD 弯箍机_钢筋弯箍机_全自动钢筋弯箍机_数控弯箍机-建科智能装备制造(天津)股份有限公司 | 全自动清洗过滤器_网式盘式过滤器_石英砂过滤器_叠片过滤器-湖南多灵过滤系统科技有限公司 | 砂金设备-淘金机械-金矿选矿设备厂家-青州冠诚重工机械有限公司 砂浆生产线_干混砂浆设备_干混砂浆生产线-苏州一工机械有限公司 | 环保除尘设备_燃气/燃油热水锅炉_光氧空气净化器_蒸汽玉米压片机_压片设备_烘干设备-山东金盾节能环保设备有限公司 |