Weitere ähnliche Inhalte
Mehr von Galaxy Software Services
Mehr von Galaxy Software Services (20)
從技術找未來
- 17. 17
即時通訊需求資訊
通訊協定: XMPP 標準
• 應用系統整合
• 組織角色權限
企業內部應用
多平台 clients
• Vitals ESP
• teamKube/teamLife
• SPEED、ITSM
• 其它如監控通知等
整合 GSS 產品
- 21. 21
2015 年計畫完成項目
• 新增聯絡⼈人與⾃自訂群組
• 我的最愛
聯絡⼈人與群組
推送通知 (Push Notification)
• 檔案傳送
• 訊息已讀/未讀顯⽰示
• 語⾳音通話
訊息功能
• Mobile: Android, iOS
• Desktop: Windows
Clients
- 23. 23
為什麼我們要做 NLP 研發?
NLP 是「智慧型系統」的
核⼼心技術
國內學術單位授權很麻煩
近年 open source 框架成
熟,我們只管核心就好
- 24. 24
核心題目
Tokenization (斷詞)
NE Recognition (專名辨識)
POS Tagging (詞類標示)
Parser (解析器)
Keyword Extraction (關鍵字擷取)
Cluster/Classification (叢集/分類)
Summarization (總結)
Emotion Detection (情緒偵測)
Recommender Systems
已建立服務;用
Vitals ESP 調整中
2015~ 研究主題
- 25. 25
Name Entity Recognition (專名辨識)
Segmentation
Named Entity
Recognition
台日交流對抗賽
昨天落幕,桃猿
領隊劉玠廷表
示…
台/ORG 日/ORG 交
流 對抗賽 昨天
落幕,桃猿 領隊
劉玠廷/PER 表
示…
Person
Location
Organization
Total
F1-measure
0.8302 0.9313 0.7439 0.8699
Perfix
劉玠廷
Suffix
劉玠廷
BigramName
領隊 劉玠廷
PosTag
劉玠廷/Nb
- 26. 26
Similar Word Extraction (相近詞萃取)
範例:[國父]
孫中山先生、辛亥革命、天下為公、遺教、誕辰紀念日、蔣公、三民主義、
豐功偉績、五權憲法、銅像、武昌起義…
非監督式學習
統計文章內詞與詞的鄰近關係
- 27. 27
進行步驟
Data Collection
Data Preprocessing
Topic Modeling
Visualization
Cluster Evaluation
Dimension Reduction
Document Clustering
Spark LDA +
GraphX
已開發的 NLP
技術
- 30. 30
總體技術策略
• Text (NLP/NER)
• Image (Feature)
• Video (Feature)
Recognition
• Text/Data Mining
• Machine Learning
• Linked Data
Discovery
- 31. 31
Linking Outside Knowledge
31
叡揚資訊/ORG為國內知識管
理、人力資源管理及信用風
險管理產品之領導者,近年
在雲端技術發展趨勢下,以
自身能力研發出兩項雲端產
品,並與國內外企業及研究
單位異業合作,並榮獲經濟
部/ORG『卓越中堅企業獎』
叡揚資訊
(Organization)
叡揚資訊自1987成立以來,在軟
體開發機制、架構、設計等方面持
續演化與進步,且總能在第一時間
點探究新技術與商業模式,這些都
是創辦人張培鏞與公司同仁一路走
來所堅持的理念:「堅持建構優質
的 軟 體 文 化 、 開 發 出 好 軟 體」。
- 38. 38
未來語意搜尋
Local Entity Repository
Enhancer
Semantic
Content Mgr
Entity Mgr
Semantic
index
Content
Store
1
2
3
Ext. LinkData