“CSIC企業(yè)行活動”是由由中國圖象圖形學(xué)學(xué)會主辦,合合信息、CSIG文檔圖像分析與識別專業(yè)委員會聯(lián)合承辦,旨在匯集產(chǎn)學(xué)研各界資源,探討圖文智能信息技術(shù)領(lǐng)域的最新發(fā)展動態(tài)和未來趨勢,共同推動圖像圖形領(lǐng)域的發(fā)展。
此次走進合合信息,深度探討“圖文智能處理與多場景應(yīng)用技術(shù)展望”主題,并特邀來自上海交大、廈門大學(xué)、復(fù)旦大學(xué)、中科大的知名學(xué)府的學(xué)者,面向行內(nèi)研究者分享圖像文檔處理中的結(jié)構(gòu)建模、底層視覺技術(shù)、跨媒體數(shù)據(jù)協(xié)同應(yīng)用、生成式人工智能及對話式大型語言模型等研究及實踐成果。
研討會嘉賓合影
會上,合合信息科技股份有限公司董事長、總經(jīng)理鎮(zhèn)立新博士發(fā)表致辭,并提到希望通過這次活動,創(chuàng)造產(chǎn)學(xué)研合作機會,為推動圖像圖形及人工智能行業(yè)的發(fā)展和進步貢獻智慧和力量。
合合信息董事長、總經(jīng)理鎮(zhèn)立新博士致辭
生成式人工智能未來十年方向的理論探索
“企業(yè)行”活動中,上海交通大學(xué)人工智能研究院常務(wù)副院長、長江學(xué)者楊小康分享表示,目前的生成式人工智能還存在解空間巨大。以“識別——分析”為代表的判別式人工智能推動了人工智能前十年的發(fā)展,接下來十年,以“合成——重建”為代表的生成式人工智能將成為主流。
復(fù)雜場景多模態(tài)數(shù)據(jù)分析與理解學(xué)術(shù)進展迅速
人工智能要實現(xiàn)多場景“通用”,需要解決多源數(shù)據(jù)的問題。廈門大學(xué)科技處處長、人工智能研究院負責(zé)人紀榮嶸教授認為連接視覺與自然語言的“視覺描述”領(lǐng)域,是最受關(guān)注且最具潛力的人工智能研究任務(wù)之一 。視覺和語言的研究應(yīng)是雙向的,各自的新發(fā)現(xiàn)、新方法可以互相迭代促進。跨空間、跨領(lǐng)域、跨任務(wù)知識遷移方面有較大探索空間,易于發(fā)現(xiàn)新的科學(xué)問題 。
底層視覺技術(shù),圖像文檔結(jié)構(gòu)分析是落地實踐重點關(guān)注方向
合合信息圖像算法研發(fā)總監(jiān)郭豐俊博士針對目前底層視覺技術(shù)在處理形變、模糊等復(fù)雜文檔時遇到的典型問題分享,合合信息智能文檔處理技術(shù)基于對圖像目標區(qū)域的精準裁剪,對彎曲、傾斜透視的頁面進行形變矯正,在去除陰影、摩爾紋后,通過人工智能技術(shù)對文檔圖像進行增強銳化和清晰度提升,達到“圖像質(zhì)量增強”的效果,在改善閱讀體驗的同時,也提升了識別轉(zhuǎn)換、圖像分析等文檔處理下游任務(wù)的質(zhì)效,相關(guān)技術(shù)已通過“掃描全能王”等智能文字識別產(chǎn)品,服務(wù)全球上百個國家和地區(qū)的上億用戶。
(新媒體責(zé)編:wa12)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務(wù)經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號