-->

whaust

2024年11月4日 星期一

Embedding 概念有哪些演算法 ?

以下是常見的Embedding 概念演算法 

演算法名稱 商業授權情況 功用 Python Library 名稱
Word2Vec 開源(Apache 2.0) 將詞語轉換為語義相似的向量,常用於詞嵌入 gensim, tensorflow
GloVe 開源(Apache 2.0) 基於詞共現矩陣生成詞嵌入,適合大規模語料庫 gensim, torchtext
FastText 開源(MIT License) 將詞拆分為子詞進行嵌入,可處理拼寫變化、少見詞 fasttext, gensim, torchtext
Doc2Vec 開源(MIT License) 文本或文件嵌入,用於段落或文件的語義表示 gensim
Universal Sentence Encoder 開源(Apache 2.0) 生成高效的句子嵌入,用於文本相似度、分類等 NLP 任務 tensorflow-hub
BERT 開源(Apache 2.0) 雙向 Transformer 模型,生成上下文語義嵌入,適用於多種 NLP 任務 transformers (Hugging Face)




沒有留言:

張貼留言

Popular