如何將人工智能技術(shù)更好地應(yīng)用到實(shí)際商業(yè)場景?

隨著 AI 技術(shù)的應(yīng)用深度與廣度不斷延伸,AI 技術(shù)為實(shí)際業(yè)務(wù)場景所帶來的價值已經(jīng)成為共識,然而,如何才能以更低的成本引入 AI 技術(shù),如何能夠以更加輕量化的方式使用 AI 技術(shù),成為值得思考的問題。
為此,InfoQ 記者在2022 QCon 全球軟件開發(fā)大會上海站的現(xiàn)場,采訪了網(wǎng)易智企算法專家李雨珂。目前,他負(fù)責(zé)數(shù)字內(nèi)容風(fēng)控領(lǐng)域的人工智能算法研究,并在 QCon 發(fā)表了《AI 服務(wù)效率升級,在智能數(shù)字內(nèi)容風(fēng)控中實(shí)踐 AI 生產(chǎn)增效》的主題演講,關(guān)于如何助力人工智能生產(chǎn)增效,他有著特別的思考。
以下是本次采訪的文字內(nèi)容。
InfoQ:感謝李老師參加 QCon 全球軟件開發(fā)大會,先請您做下自我介紹
李雨珂:我目前在網(wǎng)易智企旗下的網(wǎng)易易盾,最近一段時間主要在做基于 AI 的數(shù)字內(nèi)容風(fēng)控相關(guān)的技術(shù),我也是網(wǎng)易智企技術(shù)委員會下面 AI 分委會的負(fù)責(zé)人。
InfoQ:網(wǎng)易智企技術(shù)委員會在整個網(wǎng)易智企是扮演著什么樣的角色?以及網(wǎng)易智企技術(shù)委員會的主要職能是什么?
李雨珂:技術(shù)崗位會被分成很多類型,如果按照水平的方式去做管理有一個好處,就是不同的技術(shù)崗位能夠得到比較好的發(fā)展,在整體的發(fā)展方向上可以有一致性。實(shí)際上,這對于商業(yè)的部門來講,不一定是最好的方式。就好像我們?nèi)フ铱头?,如果有一個專屬的客服,需求響應(yīng)速度是非??斓?,而且你的體驗(yàn)也會非常好。但是如果你的客服需要通過排隊去等待,這個體驗(yàn)就會比較差。所以我們真實(shí)的組織架構(gòu),是把不同的技術(shù)崗位拆解到不同的業(yè)務(wù)當(dāng)中去,也就能夠有更強(qiáng)的戰(zhàn)斗力,或者讓這些團(tuán)隊的技術(shù)人員對于相關(guān)的業(yè)務(wù)能夠更加的熟悉,或者說更懂得商業(yè)。因此基于現(xiàn)在的組織形式,我們會去讓各個業(yè)務(wù)團(tuán)隊的研發(fā)代表站出來組成一個技術(shù)委員會,相當(dāng)于是從一個水平的角度去做支撐。
從我個人的角度理解,技術(shù)委員會主要起到以下幾個作用:
第一個方面,能夠做一些技術(shù)上的復(fù)用,至少不要重復(fù)去造輪子。這種復(fù)用包括兩個方面,其一,有一些能力我們可以直接通過 API 的形式去使用;其二,也可以去參考別人技術(shù)上的解決方案,看看他們是怎么去做的,在我們自己的真實(shí)問題中可以做借鑒;第二個方面,我們整個事業(yè)部層面會有一些水平的任務(wù)需要做支撐,技術(shù)委員會比較適合去做整體的推動和關(guān)注。舉個例子,賬號是比較適合從整個大部門的角度去做關(guān)注的,還有一些基礎(chǔ)數(shù)據(jù)的問題,也更加適合從大的部門去做整理;第三個方面,由技術(shù)的負(fù)責(zé)人一起去想一些技術(shù)分享的主題會更加合適,讓不同團(tuán)隊之間相互知道大家在做什么事情。在這個過程中也可以相互學(xué)習(xí)、相互借鑒,將其用在自己的業(yè)務(wù)領(lǐng)域里;最后,因?yàn)橛辛思夹g(shù)委員會,它會對不同業(yè)務(wù)的發(fā)展情況以及技術(shù)的使用情況有全局的概覽,也更方便我們?nèi)プ稣w技術(shù)發(fā)展方向的討論和制定。
InfoQ:在《人工智能技術(shù)應(yīng)用實(shí)踐白皮書》中了解到,網(wǎng)易智企已經(jīng)將 AI 技術(shù)在內(nèi)容風(fēng)控、音視頻、自然語言對話三個領(lǐng)域進(jìn)行了實(shí)踐,請您分別介紹下網(wǎng)易智企在以上三個領(lǐng)域針對性的解決方案。
李雨珂:首先,我會講一些共性的方向,第一部分的共同點(diǎn),它真正地解決了業(yè)務(wù)場景中的實(shí)際問題,并不是為了應(yīng)用這個 AI 技術(shù)而去用它。舉個例子,像在內(nèi)容風(fēng)控場景中,它是有復(fù)雜場景下的一些困難目標(biāo)識別問題;在自然對話場景下,它會有復(fù)雜的客戶需求需要解決;第二部分的共同點(diǎn),在應(yīng)用 AI 的過程中,我們都非常關(guān)注 AI 的效率,即引入了新的技術(shù),但是不能讓這個技術(shù)帶來更多的開銷,希望能夠輕量級地去應(yīng)用 AI 技術(shù),所以在這些解決方案中都有相關(guān)的體現(xiàn)。
展開來講,在內(nèi)容風(fēng)控場景下,我們會在算法層面做一些調(diào)優(yōu),去幫助復(fù)雜場景的識別效果進(jìn)行提升;在音視頻場景,我們會有降噪、場景分析以及超分辨率等等,以 AI 為主導(dǎo)的技術(shù)去幫助我們提升音視頻方向的體驗(yàn);在自然對話場景,我們也會通過特征檢索方式的優(yōu)化,用一些對話的框架以及沉淀的行業(yè)知識,幫助我們?nèi)ソ鉀Q復(fù)雜的客戶需求。
InfoQ:由于行業(yè)場景不同,導(dǎo)致不同行業(yè)面臨的內(nèi)容風(fēng)控的需求也有所差異,比如游戲行業(yè),未成年人監(jiān)管以及玩家信息合規(guī)是一個關(guān)注的重點(diǎn);在金融行業(yè),身份認(rèn)證、營銷欺詐等等也是需要關(guān)注的風(fēng)險問題......請問網(wǎng)易易盾是如何滿足不同行業(yè)的內(nèi)容風(fēng)控需求的?
李雨珂:第一方面是數(shù)據(jù)上的支撐,我們前期聚集到了某一個行業(yè)比較多的客戶。在這樣的前提下,我們做了相關(guān)的數(shù)據(jù)分析,針對于不同的客戶,他們有怎樣的屬性、關(guān)鍵問題等等。得到的結(jié)果是,有一些可能跟我們的理解比較一致,有一些可能超出我們的理解,無論是怎樣的發(fā)現(xiàn)都對我們理解這個行業(yè)是有幫助的。
第二個方面是水平地建立技術(shù)上的能力,比如針對未成年人的技術(shù)、特征檢索技術(shù)等等,基于這些能力,針對不同行業(yè)的解決方案就會更加靈活一些。這里可以打個比方,當(dāng)足球教練排兵布陣時,如果有更多類型的隊員進(jìn)行選擇,排兵布陣就會更加容易。
第三個方面是在對接客戶時,我們會形成一個小團(tuán)隊,其中包括技術(shù)同學(xué)、客戶運(yùn)營同學(xué)、策略同學(xué)等等。這些同學(xué)組織在一起會貼近客戶,服務(wù)于客戶的一些真實(shí)問題。在這個過程中,我們各個崗位的同學(xué)會更了解客戶,進(jìn)而更了解這個行業(yè)。
最后一點(diǎn),我們觀察到部門的管理者其實(shí)是有在關(guān)注一些新興的行業(yè),給我們增加了一些新興行業(yè)的理解和洞察,幫助我們?nèi)フ乙恍┬碌膽?yīng)用。
InfoQ:目前市場上針對內(nèi)容風(fēng)控的這個場景解決方案有很多,請您列舉一下網(wǎng)易易盾核心的優(yōu)勢
李雨珂:這個問題不同崗位的同學(xué)可能有不同的答案,我可以講一下我自己的理解。首先站在我們自身,我們就是一直長期堅持去做這么一件事情,所以我們的技術(shù)同學(xué)對于行業(yè)有非常深入的理解。因此在解決問題的時候,也會更加得心應(yīng)手一些。
其次可以站在客戶的視角去看,客戶接入一般會經(jīng)歷 POC 的過程,這個過程固然很重要,但是客戶正式接入了以后,實(shí)際上才是一個真正的起點(diǎn)。我們需要做很多和客戶共同成長的事情,幫助客戶去解決真正的問題。在解決問題的過程中,我們也不會刻意回避一些困難的問題,而是盡自己所能去做到盡善盡美。我們的技術(shù)人員也會主動識別現(xiàn)存的問題,幫助客戶去想解決方案,這樣的心態(tài)才是核心能力的體現(xiàn)。
InfoQ:在內(nèi)容風(fēng)控場景中,由于系統(tǒng)中涉及的數(shù)據(jù)維度多,不同系統(tǒng)對于數(shù)據(jù)的標(biāo)準(zhǔn)也有所不同,使得數(shù)據(jù)成為非常核心的內(nèi)容,請問您是如何看待數(shù)據(jù)標(biāo)準(zhǔn)這個問題?
李雨珂:數(shù)據(jù)標(biāo)準(zhǔn)在內(nèi)容風(fēng)控場景里確實(shí)是一個很重要的問題。因?yàn)閺娜说囊暯莵砜?,很多東西都是很主觀的,但是對于機(jī)器來講,沒有辦法得到一個認(rèn)知上的結(jié)果。所以我們在做前期模型的時候,會更加照顧機(jī)器的感受,還會制定一些偏客觀的標(biāo)準(zhǔn),幫助機(jī)器先積累一些比較基礎(chǔ)的能力。當(dāng)有了這些基礎(chǔ)能力以后,我們會在技術(shù)上做進(jìn)一步的工作,幫助機(jī)器去靠近人的認(rèn)識,這是我們在初始階段做的一些事情。最近的話我們開始在思考讓模型能夠連續(xù)輸出一些結(jié)果,更加方便在做判斷的時候進(jìn)行調(diào)控。
此外,從我們這么長時間做這件事情來看,我們不能太低估模型的能力。因?yàn)橐婚_始我們會覺得數(shù)據(jù)標(biāo)準(zhǔn)模型可能沒有辦法 Hold 住,但經(jīng)過很長時間的實(shí)踐,我發(fā)現(xiàn)模型對于一些復(fù)雜困難的數(shù)據(jù)標(biāo)準(zhǔn),它也是有一定的能力。因此這里有一個比較關(guān)鍵的點(diǎn),不要讓數(shù)據(jù)標(biāo)準(zhǔn)成為技術(shù)生長的限制,希望未來能夠讓我們的技術(shù)能力去適應(yīng)更復(fù)雜的數(shù)據(jù)標(biāo)準(zhǔn)。
InfoQ:在《人工智能技術(shù)應(yīng)用實(shí)踐白皮書》的最后一章中,我們提到了三方面的 AI 前沿技術(shù),如多模態(tài)、無監(jiān)督與超大規(guī)模 AI 系統(tǒng)以及工程自動化,請您再概括下這三方面技術(shù)在未來的潛力
李雨珂:我可能會從實(shí)用的角度來講這幾個比較新的方向。這些話題其實(shí)都是比較吸引人的,但是怎樣把它應(yīng)用到實(shí)際的商業(yè)場景中,是一個值得討論的問題。
多模態(tài)確實(shí)能夠幫助我們?nèi)ヌ嵘Ч?,但是?shí)際應(yīng)用起來,它的成本開銷也會逐步的上升。這就相當(dāng)于我們要多付出50%的工作量去多解決0.1%的問題。所以在接下來的工作中,我們從實(shí)用性的角度出發(fā),更多考慮在怎樣的時機(jī)去引入多模態(tài)的技術(shù);無監(jiān)督和超大規(guī)模也在近一段時間非常的火爆,從我們的角度來看,它要在線上直接應(yīng)用可能還有一段距離,我們使用可能會圍繞以下幾個方面:第一個,幫助我們?nèi)ド筛嗟臄?shù)據(jù),或者幫助我們?nèi)フ覍じ嗪线m的數(shù)據(jù)用于下游的訓(xùn)練;第二個,基于預(yù)訓(xùn)練模型,怎么應(yīng)用才能幫助我們得到更好的下游效果;第三個,思考怎樣利用它去做特征檢索工作。
關(guān)于工程自動化,這固然是一個很好的工具,但我始終相信一個好的工具需要有好的人來使用才能發(fā)揮最大的作用。工程自動化幫助我們在做成熟業(yè)務(wù)的時候去提升效率,但是它同時也限制了做這些業(yè)務(wù)的靈活性。所以在這個過程中,可能需要考慮效率和靈活性之間的平衡,以及怎樣培養(yǎng)更適合的人去使用這個平臺,發(fā)揮出它最大的作用。
InfoQ:明年,您個人的工作重心和規(guī)劃有哪些?有哪些重點(diǎn)關(guān)注的新方向?
李雨珂:一年多以前,我個人更多會關(guān)注怎樣用前沿的技術(shù),來幫助我們的業(yè)務(wù)場景做效果提升,但近期以及未來的工作重點(diǎn),會轉(zhuǎn)向怎樣去提升 AI 在使用過程中的效率。具體來講,在數(shù)據(jù)層面,我可能會更加關(guān)注數(shù)據(jù)科學(xué)這個方向,看看如何能夠在數(shù)據(jù)層面做更高效的事情,希望未來能夠更少使用人工的數(shù)據(jù)標(biāo)注;在算法層面,過去很長一段時間大家都在講大力出奇跡,我個人希望在未來,我們可以多看看怎樣精簡一個訓(xùn)練,去獲得更高效的結(jié)果;在服務(wù)層面的工作其實(shí)會更加細(xì)致、全面,這可能也是我自己更看重的一個方向,怎樣在服務(wù)層面去做效率上的提升,能夠支持更多類型的 AI 服務(wù)。
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由財神資訊-領(lǐng)先的體育資訊互動媒體轉(zhuǎn)載發(fā)布,如需刪除請聯(lián)系。