功能更加完備,應(yīng)用效果顯著
目前,TRS DL- CKM V9已提供數(shù)十個(gè)功能組件、數(shù)百個(gè)調(diào)用接口,具備了較為完整的NLP服務(wù)能力,基于深度學(xué)習(xí)模型的應(yīng)用效果顯著提升。
新增功能主要包括:新增多語(yǔ)種實(shí)體識(shí)別、實(shí)體鏈接、句法分析、事件抽取、機(jī)器翻譯等功能接口。
功能升級(jí)方面,新增了一批基于深度學(xué)習(xí)的接口,主要包括:自動(dòng)分類(lèi)、情感分析、文本糾錯(cuò)、自動(dòng)摘要、深度特征提取、短文本相似度、文本改寫(xiě)等。并通過(guò)引入Bert等預(yù)訓(xùn)練模型以及知識(shí)圖譜的融合等技術(shù),應(yīng)用效果比對(duì)應(yīng)的機(jī)器學(xué)習(xí)接口均有不同程度的提升。
接口易用性與吞吐量大幅提升
TRS DL- CKM V9的接口由SOAP接口升級(jí)為RESTful接口,只需通過(guò)標(biāo)準(zhǔn)的HTTP客戶(hù)端即可調(diào)用,且自帶web版演示程序,安裝后即可通過(guò)瀏覽器進(jìn)行測(cè)試和使用,方便用戶(hù)使用。新升級(jí)的Rest服務(wù)器接口性能有了較大提升,多并發(fā)吞吐量比V8版本平均提升50%以上。
快速實(shí)現(xiàn)行業(yè)化、個(gè)性化的人工智能模型開(kāi)發(fā)和構(gòu)建
作為構(gòu)建在TRS智拓語(yǔ)義智能技術(shù)平臺(tái)上的核心組件,“智語(yǔ)”可以幫助用戶(hù)快速實(shí)現(xiàn)行業(yè)化、個(gè)性化的人工智能模型開(kāi)發(fā)和構(gòu)建。其自帶一批預(yù)訓(xùn)練AI模型,包括基于BERT、GPT等預(yù)訓(xùn)練模型,CNN、RNN、LSTM、Transformer、GCN等神經(jīng)網(wǎng)絡(luò)模型……用戶(hù)可直接使用;若用戶(hù)需要基于自有數(shù)據(jù)進(jìn)行AI模型的定制開(kāi)發(fā),還可利用“智拓”平臺(tái)中的智能數(shù)據(jù)標(biāo)注服務(wù)來(lái)構(gòu)建個(gè)性化數(shù)據(jù)標(biāo)注集,使用“智拓”平臺(tái)中的模型訓(xùn)練服務(wù)進(jìn)行AI模型訓(xùn)練,并將定制模型布署到TRS DL-CKM V9上運(yùn)行。與智拓平臺(tái)的無(wú)縫集成,使”智語(yǔ)”具備了完整的NLP AI開(kāi)發(fā)和服務(wù)能力。
實(shí)現(xiàn)知識(shí)驅(qū)動(dòng)的語(yǔ)義智能
智語(yǔ)”的知識(shí)驅(qū)動(dòng)體現(xiàn)在兩方面:
1)融入行業(yè)語(yǔ)義知識(shí),將行業(yè)知識(shí)圖譜等語(yǔ)義知識(shí)應(yīng)用于深度學(xué)習(xí)中,包括融合知識(shí)圖譜的預(yù)訓(xùn)練語(yǔ)言模型、基于知識(shí)圖譜的圖神經(jīng)網(wǎng)絡(luò)模型、基于知識(shí)圖譜的圖表學(xué)習(xí)模型等,通過(guò)知識(shí)驅(qū)動(dòng)+大數(shù)據(jù)驅(qū)動(dòng),實(shí)現(xiàn)AI學(xué)習(xí)效果提升。
2)在支持知識(shí)圖譜自動(dòng)構(gòu)建基礎(chǔ)上,提供基于知識(shí)圖譜的智能搜索、自動(dòng)寫(xiě)作、智能問(wèn)答、語(yǔ)義比對(duì)等語(yǔ)義智能功能,實(shí)現(xiàn)從大數(shù)據(jù)到知識(shí)圖譜再到智能化業(yè)務(wù)的應(yīng)用閉環(huán)。
快速構(gòu)建和管理知識(shí)圖譜
“智語(yǔ)”能夠基于行業(yè)大數(shù)據(jù)快速構(gòu)建和管理知識(shí)圖譜,具體包括:
動(dòng)態(tài)本體智能構(gòu)建工具:基于信息抽取、關(guān)系發(fā)現(xiàn)、數(shù)據(jù)聚合、短標(biāo)題生成等技術(shù),自動(dòng)提煉知識(shí)概念及層次關(guān)系,輔助人工實(shí)現(xiàn)快速建模,動(dòng)態(tài)跟蹤本體語(yǔ)義變化,并主要對(duì)標(biāo)開(kāi)源本體構(gòu)建工具Protégé。
知識(shí)圖譜構(gòu)建工具:以NLP技術(shù)為基礎(chǔ),通過(guò)優(yōu)化提升實(shí)體識(shí)別、關(guān)系及事件自動(dòng)抽取、實(shí)體消岐與對(duì)齊、屬性抽取與消岐對(duì)齊、融合與推理等技術(shù),為各種行業(yè)知識(shí)圖譜應(yīng)用提供自動(dòng)構(gòu)建服務(wù)。尤其是事件分析方面,研發(fā)了獨(dú)具特色的事件分析與挖掘工具,并主要對(duì)標(biāo)全球事件庫(kù)Gdelt。
多模態(tài)融合的深度語(yǔ)義匹配
“智語(yǔ)”可與拓爾思自主研發(fā)的視頻檢索系統(tǒng)配合使用,實(shí)現(xiàn)圖像與文本的多模態(tài)融合的深度語(yǔ)義匹配。具體包括:
1)基于深度學(xué)習(xí)、NLP、圖像處理等技術(shù),應(yīng)用Bert、GCN、Resnet等算法模型,對(duì)文本及視頻建立深度語(yǔ)義索引,實(shí)現(xiàn)了OCR識(shí)別、以圖搜文、以文搜圖等功能,實(shí)現(xiàn)圖像與文本之間的跨模態(tài)語(yǔ)義檢索。
2)提供深度語(yǔ)義索引的高效編碼與索引計(jì)算技術(shù),實(shí)現(xiàn)知識(shí)圖譜與深度語(yǔ)義索引的融合。提供基于深度語(yǔ)義索引并融合知識(shí)圖譜的新一代語(yǔ)義檢索服務(wù),進(jìn)一步提升語(yǔ)義檢索效果。
提升多語(yǔ)言分析質(zhì)量,更好服務(wù)于多語(yǔ)言信息處理應(yīng)用
“智語(yǔ)”在多語(yǔ)言分析技術(shù)方面取得了長(zhǎng)足的進(jìn)展,支持常用多語(yǔ)種及特定小語(yǔ)種的分析技術(shù),實(shí)現(xiàn)實(shí)體識(shí)別、信息抽取、語(yǔ)義計(jì)算、機(jī)器翻譯等功能,有效地提升多語(yǔ)言分析的質(zhì)量,更好地服務(wù)于多語(yǔ)言信息處理應(yīng)用。