課程介紹
本課程從實戰的角度對自然語言處理(NLP)進行了全面的剖析,并結合實際案例分析和探討NLP的應用場景,給NLP相關從業人員以指導和啟迪。
培訓對象
對此課程感興趣的人員;
從事計算機語言工作的IT人員;
從事數據分析數據管理的IT人員。
課程收益
掌握NLP基礎;
關鍵詞提取與文本分類方法;
文本向量化與句法分析方法;
NLP與深度學習技術的相應算法;
理解并掌握Tensorflow框架。
知識概要
-- NLP入門與基礎介紹;
-- 關鍵詞提取與文本分類;
-- 文本向量化與句法分析;
-- NLP與深度學習。
課程大綱
NLP入門與基礎介紹(一)
1.NLP的基本概念
2.NLP的發展歷程
3.NLP主要研究方向
1)句法語義分析
2)信息抽取
3)文本挖掘
4)機器翻譯
5)信息檢索
6)問答系統
7)對話系統
NLP入門與基礎介紹(二)
4.NLP的基礎
1)分詞
正向最大匹配算法
逆向最大匹配算法
雙向最大匹配算法
基于N-gram語言模型的分詞
基于HMM的分詞方法
基于CRF的分詞法法
2)文本基本處理
文本提取
正在表達式
本文統計
3)詞性標注
基于最大熵的詞性標注
基于統計最大概率輸出詞性
基于HMM詞性標注
基于CRF的詞性標注
4)命名實體識別
基于CRF的命名實體識別
5.案例
1)在線中文分詞系統實戰
2)命名實體識別接口開發
3)基于詞性標注的關鍵詞提取
關鍵詞提取與文本分類
1.關鍵詞提取概述
2.關鍵詞提取算法
1)TF-IDF
2)LSA/LSI算法
3)PLSA算法
4)LDA算法
3.文本分類算法
1)樸素貝葉斯
2)線性分類器
3)支持向量機
4)Bagging模型
5)Boosting模型
6)淺層神經網絡
4.案例
1)新聞主題提取
2)新聞分類實戰
文本向量化與句法分析
1.文本向量化概述
2.文本向量化常用算法
1)詞袋算法
2)HashTF算法
3)Word2Vec算法
4)Glove算法
3.句法分析概述
4.句法分析常用算法
1)PCFG算法
2)條件隨機場算法
5.案例
1)文本情感分析的開發示例
2)基于依存句法分詞的問句相似度計算
NLP與深度學習(一)
1.深度學習概述
1)神經網絡
2)損失函數
3)梯度下降
2.深度學習常用算法
1)CNN
2)RNN
3)GRU
4)LSTM
NLP與深度學習(二)
3.Tensorflow框架學習
1)Tensorflow簡介
2)Tensorflow安裝
3)Tensorflow基礎使用
圖(graphs)
會話(session)
張量(tensor)
變量(Variable)
4)Tensorflow線性回歸以及分類的簡單使用
5)Tensorflow中各種優化器的介紹
4.案例
1)基于CNN的文本分類
2)基于RNN的歌詞生成
3)基于LSTM的機器翻譯
4)基于Seq2Seq的問答系統
認證過程
無認證考試
開班信息
暫無開班信息