加入收藏 | 设为首页 | 会员中心 | 我要投稿 51站长网 (https://www.51zhanzhang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
站内搜索:
当前位置: 首页 > 大数据 > 正文

【重!磅!干!货

发布时间:2021-03-19 04:09:43 所属栏目:大数据 来源:网络整理
导读:查看之前文章请点击右上角 , 关注 并且 查看历史消息 ,还可以在文章最后评论留言。谢谢您的支持! 回复【 文本挖掘 】 或者 【 点击阅读原文 】 获取链接与代码附录 一、 功能概述 ? ? ? ?关键词词频网络图是以股票论坛、 个股新闻、研究报告三个网站作为

运行结果:

【重!磅!干!货


2) 检索模块
路径:?D:TotalCodeLuceneCodeIndex_SearchIndexFiles_pylucene.py
功能: 增量建立索引
输入参数:<数据目录> <索引目录> <开始日期> <结束日期>
运行举例:python IndexFiles_pylucene.py D:DATAtext D:DATAIndextext
20120715 20120820

运行过程实例:

【重!磅!干!货

运行结果:

【重!磅!干!货


路径:?D:TotalCodeLuceneCodeIndex_SearchSearchFiles_pylucene.py
功能: 关键词全文检索
输入参数:<索引目录> <关键词> <输出文件>
运行举例:python SearchFiles_pylucene.py D:DATAIndextext "页岩气 "

D:TotalCodeLuceneCodeIndex_SearchOutput_pylucene.txt

运行过程实例:

【重!磅!干!货


【重!磅!干!货


3)统计模块举例1个,其余不再呈现
路径:?D:TotalCodeLuceneCodeICTCLAS_Cal/IDFCal.py
功能: 计算关键词所在文档数
输入参数:<数据源> <开始日期> <结束日期>
运行举例:python IDFCal.py 股票论坛 20120715 20120820

运行过程实例:

【重!磅!干!货

运行结果:


4)关键词词频模块举例1个,其余不再呈现
路径:?D:TotalCodeLuceneCodeICTCLAS_ IDF/ sigWordSeq.py
功能:?关键词词频时间序列
输入参数:<数据源> <关键词> <股票代码> <开始日期> <结束日期> <是否搜索标识>
运行举例:python sigWordSeq.py 股票论坛 "物联网" 000001 20100601?20120820 1

运行过程实例:

【重!磅!干!货

运行结果:

【重!磅!干!货


路径:D:TotalCodeLuceneCodeICTCLAS_ IDF/ WordNet.py
功能:?完整关键词网络图
输入参数:<数据源> <关键词> <开始日期> <结束日期>
运行举例:python WordNet.py 研究报告 "页岩气" 20120601 20120817
运行过程实例:

【重!磅!干!货

(编辑:ASP站长)

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关内容
未处理完善
    无相关信息
未处理完善