米納電商 - 十堰電商綜合服務平台     |    0719-8611728

阿裏給所有賣家發福利:全球首個(indivual)人(people)工智能中文字庫免費用(use)

2018-02-27 476 浏覽

字體生(born)成技術-簡版

你打開手機淘寶,精美的(of)海報讓你目不(No)轉睛,你下了(Got it)單,從快遞員手中接過商品,心滿意足的(of)那一(one)刻,你不(No)會想到(arrive)自己在(exist)掏錢買下商品的(of)同時(hour)也爲(for)海報買了(Got it)單,從模特、攝影到(arrive)設計師的(of)後期處理,越精美的(of)海報成本越高,當然,你更想不(No)到(arrive)的(of)是(yes),海報上的(of)每一(one)個(indivual)字都是(yes)要(want)花錢的(of)……

最近,阿裏巴巴悄悄推出(out)了(Got it)全球首個(indivual)人(people)工智能中文字庫,這(this)款阿裏漢儀智能黑體測試版,目前擁有3500個(indivual)中文漢字,将免費提供給阿裏用(use)戶使用(use)。

服務市場下載頁

服務市場下載頁

這(this)既是(yes)阿裏給電商賣家的(of)春節福利,也是(yes)一(one)種新的(of)嘗試,阿裏希望用(use)技術手段,降低造字成本,讓字體市場進入良性發展。而這(this)項技術的(of)受惠者,除了(Got it)商家、字體公司,當然還包括了(Got it)消費者。

一(one)套版權費20萬的(of)字體

一(one)套正版字體價值不(No)菲。

據悉,天貓上某商家就爲(for)一(one)套方正蘭亭字體支付了(Got it)20萬元左右的(of)版權費,雖然14款不(No)同字體可以(by)使用(use)5年,但對商家來(Come)講,“要(want)價還是(yes)偏高”。

萬一(one)有适合廣告宣傳的(of)收費字體,但前期沒有購買版權怎麽辦?

讓設計師對已有的(of)字體進行修改加工,變成新的(of)字體,是(yes)一(one)種解決辦法。然而一(one)位設計師曾花了(Got it)半天時(hour)間,隻設計出(out)6個(indivual)中文漢字。

“修改設計每個(indivual)單字不(No)難,把控字體的(of)統一(one)性才是(yes)最難的(of)。”該設計師表示,例如“品”“門”“口”這(this)樣的(of)字結構過于(At)單一(one),在(exist)修改時(hour)反而會增加難度。“有時(hour)會發現,組合成的(of)一(one)句話中出(out)現了(Got it)兩種字體,甚至6個(indivual)字的(of)标題中會出(out)現6種字體,很頭疼。”

出(out)于(At)成本考慮,一(one)些商家并不(No)願意在(exist)購買字體版權上花錢,隻使用(use)阿裏平台上免費商用(use)的(of)華康字體和(and)開源字體。

還有部分商家,則選擇使用(use)未經授權的(of)字體,踩中了(Got it)涉嫌“字體侵權”的(of)雷區。一(one)旦被字體公司起訴,商家除了(Got it)賠錢,還要(want)撤回已經發布的(of)字體内容,企業的(of)品牌形象和(and)銷售業績都會受到(arrive)影響。

爲(for)什麽造字成本這(this)麽高

一(one)套字體爲(for)何要(want)價萬元,字體公司爲(for)何四處維權打官司?侵權與維權的(of)背後,不(No)僅僅是(yes)利益的(of)撕扯,還有關于(At)創意價值的(of)認可度。

用(use)傳統的(of)方法創造一(one)套字體,其實成本很高,因爲(for)需要(want)經過創意、選字、确定、拼字、自動分裝等一(one)系列漫長的(of)流程。

輪播

一(one)套字體通常有兩個(indivual)特點:字型和(and)字量。字型是(yes)設計師對字體的(of)“創意”,字庫字體講究整體的(of)搭配協調和(and)美感。

而每套字體的(of)字量通常由市場需求決定。常用(use)的(of)中文簡體有6763個(indivual)中文漢字,包含中文簡繁的(of)9169個(indivual),用(use)于(At)出(out)版物的(of)大(big)字符集(包含很多生(born)僻字)27533個(indivual),包含稀有地(land)名人(people)名用(use)字的(of)超大(big)字符集包含中文7萬字以(by)上。

傳統字體公司的(of)設計師,可以(by)設計出(out)很獨特的(of)單個(indivual)中文字體,但即便是(yes)難度相對低的(of)字型,他(he)們(them)也很難獨立完成整套設計。通常是(yes),主創意者創作(do)五六百個(indivual)字,确定字體的(of)基調後,再由團隊其他(he)成員完成剩下的(of)工作(do)。

每一(one)個(indivual)字都要(want)經過設計師一(one)筆一(one)畫地(land)仔細勾勒、調整。通常,設計一(one)套風格字庫需要(want)設計1萬個(indivual)左右的(of)字符和(and)标點符号,少則半年、多則好幾年才能進入市場。而且,設計出(out)的(of)字體還可能因爲(for)不(No)受用(use)戶歡迎而宣告失敗。

設計成本居高不(No)下,導緻正版字體價值不(No)菲,而正版支持者越少,造字成本越高,價格更加降不(No)下來(Come),造字市場就會陷入惡性循環。

怎麽用(use)人(people)工智能造字

阿裏巴巴每年也要(want)向字體公司支付金額可觀的(of)版權費用(use),就像阿裏人(people)機自然交互實驗室經常與字體打交道,因爲(for)他(he)們(them)的(of)一(one)個(indivual)研究方向就是(yes)設計智能。

“字體相當于(At)設計領域的(of)水電煤。”實驗室負責人(people)楊昌源說,“有的(of)字體真的(of)很好看,我(I)們(them)真的(of)很想用(use),但是(yes)太貴了(Got it)。”

正版字體這(this)麽貴,有沒有可能讓造字成本變低?楊昌源決定帶領團隊在(exist)字體領域做一(one)個(indivual)新的(of)嘗試,用(use)AI生(born)成字體。

“阿裏有人(people)才有技術有資源來(Come)做這(this)件事情。”楊昌源覺得,造出(out)一(one)款免費字體,對阿裏來(Come)講很有價值,既能讓商家不(No)再擔心版權問題,也能讓字體市場變得更加健康。

彼時(hour),實驗室正好與阿裏PAI團隊在(exist)其他(he)業務上有所交集,後者主要(want)負責基于(At)阿裏雲分布式計算引擎的(of)一(one)款機器學習算法平台,“能不(No)能提供技術支持我(I)們(them)做些事?”楊昌源向對方發出(out)了(Got it)合作(do)邀請。

實驗室想要(want)引入新的(of)技術改變現狀,PAI團隊想要(want)試驗新的(of)技術,雙方一(one)拍即合,很快達成跨團隊合作(do)的(of)意向,他(he)們(them)打算讓機器做出(out)一(one)套“跟人(people)做的(of)一(one)模一(one)樣的(of)”精美的(of)字體。

此次AI造字,PAI團隊的(of)人(people)工智能專家張慶、孫東慧針對字體生(born)成的(of)特定場景将對抗生(born)成網絡(GAN)進行了(Got it)改進。

團隊先用(use)天貓字體和(and)淘字體做嘗試,但由于(At)兩類字體的(of)樣本量太少,在(exist)手動補充字體樣本,用(use)了(Got it)一(one)兩百組算法模型後,設計團隊仍認爲(for),字體的(of)精準度不(No)夠,還是(yes)半成品。

“因爲(for)做精準設計的(of)設計師擁有像素級的(of)眼睛,左偏了(Got it)一(one)個(indivual)像素都不(No)舒服。” 楊昌源解釋道。

兩個(indivual)團隊在(exist)标準上不(No)能達成一(one)緻,AI造字陷入瓶頸。

造一(one)套自帶流量的(of)字

調整方向還是(yes)就此放棄?楊昌源決定,引入專業的(of)字體公司一(one)起來(Come)制定标準。

找字體公司合作(do)并非一(one)帆風順。“起初談的(of)時(hour)候蠻難的(of),字體公司的(of)危機感比我(I)們(them)強很多。”楊昌源表示。

很多人(people)懼怕人(people)工智能技術。最初,字體公司擔心,自己的(of)生(born)意甚至是(yes)整個(indivual)字體行業會“沒了(Got it)”,更擔心阿裏這(this)個(indivual)巨頭會不(No)會進入字體這(this)個(indivual)商業航道。

“字體并不(No)在(exist)阿裏的(of)主航道上,我(I)們(them)沒有野心深度介入字體行業。”楊昌源反複向對方解釋,用(use)人(people)工智能造字,是(yes)想要(want)嘗試将新技術運用(use)到(arrive)傳統的(of)字體領域,“我(I)們(them)不(No)會跟傳統行業直接去競争,我(I)們(them)更多是(yes)給大(big)家一(one)個(indivual)示範,畢竟專業領域的(of)事情還是(yes)要(want)靠專業的(of)人(people)去做。”

在(exist)合同上來(Come)來(Come)回回讨論了(Got it)個(indivual)把月後,去年12月,漢儀終于(At)與阿裏簽訂了(Got it)合同,決定雙方聯手做一(one)套有AI技術成分的(of)字體。雙方決定合作(do)的(of)字體是(yes)漢儀公司的(of)明星産品,AI造的(of)字體相當于(At)是(yes)給這(this)個(indivual)系列産品做了(Got it)延伸。

楊昌源說,“簽下合同後,我(I)們(them)定下目标:農曆年前,一(one)定要(want)出(out)一(one)個(indivual)版本給大(big)家看,看能到(arrive)什麽程度。”

這(this)次合作(do)中,漢儀字庫的(of)設計師負責字體的(of)造型設計,阿裏的(of)技術團隊負責技術,最終通過“喂養”機器,讓其自學并生(born)成了(Got it)一(one)套字庫。

阿裏漢儀智能黑體字形設計

阿裏漢儀智能黑體字形設計

在(exist)大(big)數據的(of)幫助下,漢儀字庫設計部負責人(people)鄭乃玉了(Got it)解到(arrive),一(one)套字體設計出(out)約3500字就能覆蓋常用(use)的(of)電商廣告用(use)語。

讓字體設計師們(them)糾結的(of)是(yes),什麽樣的(of)字體能幫助電商提升銷量。他(he)們(them)希望造出(out)一(one)套“自帶流量”的(of)字體,鄭乃玉說,“例如,商品廣告中‘降價了(Got it)’這(this)樣突出(out)的(of)語言最适合使用(use)現在(exist)的(of)字體。”

“不(No)能以(by)人(people)爲(for)标準去評判AI字體的(of)好壞。”楊昌源表示,評價字體好壞的(of)标準是(yes),生(born)成的(of)字體跟樣本字體有90%以(by)上的(of)神似即可,“至少看上去,它像一(one)套字體。”

2018年1月22日,阿裏巴巴終于(At)推出(out)了(Got it)全球首個(indivual)人(people)工智能中文字庫——阿裏漢儀智能黑體,并免費提供給阿裏用(use)戶使用(use)。

正式版将于(At)4月推出(out)

在(exist)這(this)套智能字庫測試版本發布當天,景德鎮胡圖網絡科技公司的(of)設計師們(them)在(exist)第一(one)時(hour)間就下載使用(use)了(Got it),設計部的(of)胡經理解釋,他(he)們(them)的(of)設計師主要(want)做電商設計的(of)排版,自己根本沒有時(hour)間設計字體,“現在(exist)又有新的(of)選擇,還是(yes)AI生(born)成的(of),當然要(want)馬上試用(use)一(one)下。”

試用(use)後,胡經理也發現了(Got it)測試版的(of)一(one)些問題,例如螺蛳粉中的(of)“蛳”、聚會中的(of)“聚”字在(exist)被放大(big)後會顯得棱角不(No)明,像是(yes)沒有切割完整。另外,阿裏這(this)套字體隻适用(use)于(At)醒目的(of)大(big)标題,8号、12号大(big)小的(of)字體就不(No)夠清晰且略顯粗糙。

胡經理發現測試版中字體的(of)一(one)些問題

胡經理發現測試版中字體的(of)一(one)些問題

漢儀字庫設計部負責人(people)鄭乃玉表示,AI隻能生(born)成字體,并不(No)會自己做調整,人(people)機協作(do)是(yes)目前的(of)最佳手段,“橫平豎直、棱角分明的(of)漢字還是(yes)要(want)靠人(people)工幹預。”

楊昌源也坦言,測試版本不(No)完美,還在(exist)繼續優化。2018年4月,“阿裏漢儀智能黑體”将推出(out)正式版本,最終字符集可能是(yes)6763,未來(Come)将用(use)于(At)服務阿裏新零售下千萬商家及阿裏設計生(born)态。

字體機器生(born)成過程(終稿)

字體機器生(born)成過程

人(people)工智能改變字體行業

電商賣家成千上萬,消費者喜歡的(of)風格也五花八門,胡經理就發現,女性用(use)戶更喜歡秀氣的(of)字體,但這(this)套人(people)工智能字庫的(of)字體略顯粗犷。

對此,楊昌源表示,“阿裏在(exist)字體領域做嘗試是(yes)想告訴大(big)家,字體領域是(yes)可以(by)有這(this)樣一(one)個(indivual)成果的(of),進而鼓勵大(big)家在(exist)有奔頭的(of)情況下去做一(one)些嘗試。”

“我(I)們(them)想解決的(of)是(yes),當創意很好的(of)時(hour)候,怎麽加速創意産生(born)到(arrive)生(born)成的(of)過程。以(by)前設計一(one)套字體需要(want)投入10個(indivual)人(people)做一(one)年,現在(exist)引進新技術,能夠節省4-8個(indivual)月的(of)時(hour)間,可以(by)讓字體設計人(people)員把注意力更多的(of)放在(exist)創意上。” 楊昌源表示。

按照楊昌源的(of)想象,未來(Come),字體行業可能是(yes)另一(one)個(indivual)景象。“字體生(born)态豐富起來(Come),字體的(of)版權也許就不(No)會那麽貴了(Got it)。”

AI造字的(of)過程中,也産生(born)了(Got it)副産品。“字體檢測,我(I)們(them)能夠做的(of)很精準了(Got it)。” 楊昌源透露,現在(exist)他(he)們(them)可以(by)檢測某字體可能盜用(use)了(Got it)哪幾款正版字體,并提供相應的(of)概率。

在(exist)造“阿裏漢儀智能黑體”的(of)同時(hour),團隊從市面上收集來(Come)雍正的(of)毛筆字,臨摹出(out)來(Come)後給機器學習,機器通過自學仿造出(out)了(Got it)雍正字體。這(this)項技術無疑将給字體行業、文物及博物館修複帶來(Come)一(one)些新的(of)嘗試和(and)可能性。

雍正字體驗H5 1

機器學習的(of)雍正字體

楊昌源開玩笑說,“以(by)後過年,可以(by)讓‘雍正賜字’,給電商賣家做些好彩頭。”

來(Come)源 米納電商