u1jodi1q 发表于 2024-8-17 08:13:02

Python 最强自然语言处理工具,比NLTK强一百倍!


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">Stanza 是一款由斯坦福大学 NLP 组<span style="color: black;">研发</span>的自然语言处理库,旨在为<span style="color: black;">科研</span>人员和<span style="color: black;">研发</span>者<span style="color: black;">供给</span><span style="color: black;">有效</span>、准确的多语言 NLP 工具。其设计注重速度和准确性,并支持多种语言,如英语、中文、法语和德语等。Stanza <span style="color: black;">供给</span>了一系列功能,<span style="color: black;">包含</span>分词、词性标注、命名实体识别和依存句法分析等。与其他 NLP 库相比,Stanza <span style="color: black;">运用</span>预训练的神经网络模型进行<span style="color: black;">各样</span>任务,<span style="color: black;">供给</span>了高度可配置的模型和流水线,以满足<span style="color: black;">区别</span>的需求。</span></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">安装:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">pip install stanza </p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">中文处理实例:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">import stanza import os nlp = stanza.Pipeline(lang=zh, processors=tokenize,lemma,pos,download_method=None) text = "在爱情的世界里,每一个眼神都是一首深情的诗,每一个微笑都是一幅温馨的画,而每一次相遇都是命运的安排。" doc = nlp(text) for sentence in doc.sentences: for word in sentence.words: print(f"{word.text} {word.lemma} {word.pos}")</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">输出:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2024-06-09 20:38:07 INFO: Using device: cpu 2024-06-09 20:38:07 INFO: Loading: tokenize 2024-06-09 20:38:07 INFO: Loading: pos 2024-06-09 20:38:07 INFO: Loading: lemma 2024-06-09 20:38:07 INFO: Done loading processors! 在 在 ADP 爱情 爱情 NOUN 的 的 PART 世界 世界 NOUN 里 里 ADP , , PUNCT 每 每 DET 一 一 NUM 个 个 NOUN 眼神 眼神 NOUN 都是 是 AUX 一 一 NUM 首 首 NOUN 深情 深情 ADJ 的 的 PART 诗 诗 NOUN , , PUNCT 每 每 DET 一 一 NUM 个 个 NOUN 微笑 微笑 NOUN 都是 是 AUX 一 一 NUM 幅 幅 NOUN 温馨 温馨 ADJ 的 的 PART 画 画 NOUN , , PUNCT 而 而 ADV 每 每 DET 一 一 NUM 次 次 NOUN 相遇 相遇 NOUN 都是 是 AUX 命运 命运 NOUN 的 的 PART 安排 安排 NOUN 。。PUNCT</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">英文翻译:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">ADP: 介词 PART: 介词或小品词 NOUN: 名词 PUNCT: 标点 DET: 限定词 NUM: 数词 AUX: 助动词 ADJ: 形容词 ADV: 副词 </p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">可能<span style="color: black;">显现</span>问题:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">下载模型文件失败<span style="color: black;">能够</span>手动下载模型文件和json文件到复制到stanza_resources目录里:</span></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">json文件:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">https://gitee.com/pingyuanyi/stanza-resources </p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">模型文件:</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">https://gitee.com/modelee/stanza-zh-hans </p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q5.itc.cn/q_70/images03/20240609/4562d5862d064795888bd3f9c79327e1.jpeg" style="width: 50%; margin-bottom: 20px;"><a style="color: black;"><span style="color: black;">返回<span style="color: black;">外链论坛:www.fok120.com</span>,查看<span style="color: black;">更加多</span></span></a></p>

    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">责任编辑:网友投稿</span></p>




m5k1umn 发表于 2024-9-29 07:29:21

真情实感,其含义为认真了、走心了的意思,是如今的饭圈常用语。

qzmjef 发表于 2024-10-9 21:31:37

百度seo优化论坛 http://www.fok120.com/

nykek5i 发表于 2024-10-15 19:50:50

交流如星光璀璨,点亮思想夜空。

qzmjef 发表于 2024-10-18 03:38:22

论坛的成功是建立在我们诚恳、务实、高效、创新和团结合作基础上,我们要把这种精神传递下去。

1fy07h 发表于 2024-10-18 09:33:20

你的话语真是温暖如春,让我心生感激。

qzmjef 发表于 2024-10-24 10:02:30

感谢楼主分享,祝愿外链论坛越办越好!
页: [1]
查看完整版本: Python 最强自然语言处理工具,比NLTK强一百倍!