|
|
|
|
LEADER |
00000nam a2200000Ma 4500 |
001 |
OR_on1249106013 |
003 |
OCoLC |
005 |
20231017213018.0 |
006 |
m o d |
007 |
cr cn||||||||| |
008 |
210501s2018 xx go 0o0 0 chi d |
040 |
|
|
|a TOH
|b eng
|c TOH
|d OCLCO
|d VT2
|d STF
|d UPM
|d TOH
|d OCLCQ
|
066 |
|
|
|c $1
|
020 |
|
|
|a 9787111588559
|
020 |
|
|
|a 711158855X
|
024 |
8 |
|
|a 9787111588559
|
029 |
1 |
|
|a AU@
|b 000071520499
|
035 |
|
|
|a (OCoLC)1249106013
|
049 |
|
|
|a UAMI
|
100 |
1 |
|
|a Silge, Julia,
|e author.
|
245 |
1 |
0 |
|6 880-99
|a <>.
|
250 |
|
|
|a 1st edition.
|
264 |
|
1 |
|b China Machine Press,
|c 2018.
|
300 |
|
|
|a 1 online resource (170 pages)
|
336 |
|
|
|a text
|b txt
|2 rdacontent
|
337 |
|
|
|a computer
|b c
|2 rdamedia
|
338 |
|
|
|a online resource
|b cr
|2 rdacarrier
|
347 |
|
|
|a text file
|
365 |
|
|
|b 9.08
|
542 |
|
|
|f Copyright ©Julia Silge, David Robinson.
|g 2017
|
550 |
|
|
|a Made available through: Safari, an O'Reilly Media Company.
|
588 |
0 |
|
|a Online resource; Title from title page (viewed March 1, 2018).
|
590 |
|
|
|a O'Reilly
|b O'Reilly Online Learning: Academic/Public Library Edition
|
700 |
1 |
|
|a Robinson, David,
|e author.
|
710 |
2 |
|
|a O'Reilly for Higher Education (Firm),
|e distributor.
|
710 |
2 |
|
|a Safari, an O'Reilly Media Company.
|
856 |
4 |
0 |
|u https://learning.oreilly.com/library/view/~/9787111588559/?ar
|z Texto completo (Requiere registro previo con correo institucional)
|
880 |
1 |
0 |
|6 245-99
|a 文本挖掘:基于R 语言的整洁工具 /
|c Silge, Julia.
|
880 |
|
|
|6 520-00
|a 当前很多数据都是非结构化的大规模文本,这给分析和可视化带来了挑战。本书使用实用的tidytext软件包来介绍文本挖掘技术,该包是由Julia Silge和David Robinson共同开发的R软件包(类似于ggplot2和dplyr软件包),开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。 本书展示如何将文本转换为数据框,然后提取和可视化文本的特征;并介绍如何将自然语言处理(NLP)融入有效的工作流程中;实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。 如何将tidytext格式应用于NLP 用情感分析方法挖掘文本中的情感内容 以词频作为衡量标准来确定文档中最重要的词项 使用ggraph和widyr软件包来分析单词之间的关系 在R的整洁格式和不整洁文本格式之间互相转换 使用主题建模对文档集合进行分类 案例研究:Twitter归档文件比较、挖掘NASA元数据、分析数千个Usenet消息
|
994 |
|
|
|a 92
|b IZTAP
|