https://hidadeng.gitee.io
2021暑期python数据挖掘、Stata计量建模、Matlab结构模型工作坊。本项目主要用于发布课程信息、预习资料等。
中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。
中文复合事件抽取,能识别文本的模式,包括条件事件、顺承事件、反转事件等,可以用于文本逻辑性分析。
如果采集的数据有很多图片、音频视频链接,虽然Nvivo可以进行多媒体分析,但是需要事先下载好的多媒体文件导入到Nvivo才能进行。多媒体数据处理属于很hitech的部分,很难,大邓也不会(⊙o⊙)…。 所以对于小白或者文科生而言还是没法用python自动化快速实现多媒体数据的标注,但是却可以让我们的标注过程更高效。今天介绍的label-studio库可以在没下载相关多媒体情况下,仅仅依靠图片、音频、视频的链接即可联网打开,进行标注。
使用SO_PMI互信息算法简单快速构建不同领域(手机、汽车等)的专业情感词典
bsite是用于采集B站用户视频列表页、视频评论数据的python包。
涵盖网络爬虫、数据库、数据分析、机器学习、可视化、文本分析、GUI、自动化办公
含Python语法入门、网络爬虫、文本分析、机器学习等,全部课程均含有代码课件,欢迎前来学习
简单好用的lda话题模型,支持中英文。该库基于gensim和pyLDAvis,实现了lda话题模型及可视化功能。
matplotlib: plotting with Python
解决[bar_chart_race库](https://github.com/dexplo/bar_chart_race)不支持中文的问题
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP