想和朋友分享您喜歡的安卓應用和蘋果應用? 我想發上微博該是個不錯的主意, 更高效的應用平臺:App Store瀏覽太麻煩? 沒法找到高質量的應用? 下載安卓應用大全和蘋果應用大全 省時!省力!!省心!搜索功能強大,搜索結果優先列出限免軟件和免費軟件。 微信小程序找不到解決方法: 想必各位的朋友圈已經被微信小程序刷屏了,然而細心的觀眾可能發現了一些問題: 1.小程序名字怎么都奇奇怪怪的? 2.怎么也搜不到自己想要的小程序? 比如下面,簡直慘不忍睹,如果不是提前知道完整全名,幾乎搜不出來。 于是,犀利的網友開始吐槽: 對于一個APP重度使用者來說,小程序意味著一早上起來就解英格瑪密碼 然而有朋友發現,有的小程序只有通過全文才能搜索出來,然而搜索「京東」卻能出來「京東購物」、搜索「滴滴」也能出來「滴滴出行DiDi」、搜索「攜程」也能出來「攜程酒店機票火車票」,這又是為何? 這里就涉及到了一個「中文分詞」技術和「模糊匹配」技術了。(對技術科普沒興趣的可直接跳過,后面有小程序名單和商店) 中文分詞技術 我們知道,在英文的行文中,單詞之間有空格作為自然分界符,比如下面這句: I am very handsome ! 可以輕松地分成i、am、very、handsome四個單詞。而中文只是字、句和段能通過明顯的分界符來簡單劃界,唯獨詞沒有一個形式上的分界符。 比如這一句廣告語: 南京市長江大橋歡迎您! 你可以理解為:南京,市長,江大橋,歡迎,您;也可以理解為:南京市,長江大橋,歡迎,你。不同的分詞方法得到的結果就截然不同。 現代漢語的基本表達單元雖然為“詞”,且以雙字或者多字詞居多,但由于人們認識水平的不同,對詞和短語的邊界很難去區,比如: 對隨地吐痰者給予處罰 “隨地吐痰者”本身是一個詞還是一個短語,不同的人會有不同的標準,同樣的“海上”“酒廠”等等,即使是同一個人也可能做出不同判斷,如果漢語真的要分詞書寫,必然會出現混亂,難度很大。 中文分詞(Chinese Word Segmentation)指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續的字序列按照一定的規范重新組合成詞序列的過程。和英文相比,中文分詞難得多得多! 蘋果應用引領新的上網速度革命,給您帶來超快體驗。 |
溫馨提示:喜歡本站的話,請收藏一下本站!