詞條
詞條說明
隨著計算機技術和網絡技術的*發展,互聯網上共享的文本呈海量趨勢增長,包括各種環境下的大文本和社交媒體文本等。如何有效存儲、管理、檢索和使用這些文本數據,是擺在人們面前巨大的挑戰和亟待解決的研究問題。文本語義分析與挖掘是解決上述問題的基礎。 互聯網大環境下的共享文本具備特殊的屬性:1)半結構化;2)多尺度;3)海量;4)復雜關聯;5)多樣化。LJParser文本語義分析系統結合人工智能、統計分析
詞法分析是自然語言處理的基礎與關鍵,是計算機科學中將字符序列轉換為單詞序列的過程。基本任務是從字符串表示的源程序中識別出具有獨立意義的單詞符號,其基本思想是根據掃描到單詞符號的**個字符的種類,拼出相應的單詞符號。 靈玖LJParser中文分詞系統是靈玖軟件經過多年研究工作積累的基礎上,研制出的分詞系統,主要功能包括中文分詞;英文分詞;詞性標注;命名實體識別;新詞識別;關鍵詞提取;支持用戶專業詞
文本挖掘(Text Mining)是一個從結構化或非結構化文本信息中獲取用戶感興趣或者有用的模式的過程。文本挖掘的主要目的是從非結構化文本文檔中提取有趣的、重要的模式和知識。可以看成是基于數據庫的數據挖掘或知識發現的擴展。 文本挖掘是從數據挖掘發展而來,因此其定義與我們熟知的數據挖掘定義相類似。但與傳統的數據挖掘相比,文本挖掘有其*特之處,主要表現在:文檔本身是半結構化或非結構化的,無確定形式并
在信息化高度發達的今天,互聯網已經成為人們獲取信息,即時溝通的重要媒介之一,給人們工作生活帶來了很大的便利。但是由于其**性、開放性、即時性的特點,互聯網也成為眾多信息傳播的重要途徑,與傳統媒體相比較為棘手。如何對互聯網進行有效的管理,過濾其中的不良信息,凈化網絡環境成為苛待解決的問題。 目前網絡中70%的信息是以文本形式存在,網頁文本過濾成為目前網絡監控的較重要手段。文本過濾方法有很多,關鍵字
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區蘇州街49-3號盈智大廈5層
郵 編: