天才教育網(wǎng)合作機(jī)構(gòu) > 電腦培訓(xùn)機(jī)構(gòu) > 編程語(yǔ)言培訓(xùn)機(jī)構(gòu) >

全國(guó)python學(xué)習(xí)中心

歡迎您!
朋友圈

400-850-8622

全國(guó)統(tǒng)一學(xué)習(xí)專(zhuān)線 9:00-21:00

位置:電腦培訓(xùn)資訊 > 編程語(yǔ)言培訓(xùn)資訊 > python云,什么是云計(jì)算?python是一種什么編程語(yǔ)言?云計(jì)算和python有什么關(guān)系?

python云,什么是云計(jì)算?python是一種什么編程語(yǔ)言?云計(jì)算和python有什么關(guān)系?

日期:2021-07-25 09:48:58     瀏覽:599    來(lái)源:全國(guó)python學(xué)習(xí)中心
核心提示:不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python云,就多了一項(xiàng)技能,還怕找不到工作?,還怕不好找工作?小編就來(lái)告訴你這個(gè)專(zhuān)業(yè)的優(yōu)勢(shì)到底體現(xiàn)在哪里:Python點(diǎn)云數(shù)據(jù)處理(一)點(diǎn)云工具箱功能介紹,

不管你是待業(yè)還是失業(yè),在這個(gè)被互聯(lián)網(wǎng)圍繞的時(shí)代里,選擇python云,就多了一項(xiàng)技能,還怕找不到工作?,還怕不好找工作?小編就來(lái)告訴你這個(gè)專(zhuān)業(yè)的優(yōu)勢(shì)到底體現(xiàn)在哪里:Python點(diǎn)云數(shù)據(jù)處理(一)點(diǎn)云工具箱功能介紹,Python生成詞云圖太簡(jiǎn)單了|拿來(lái)就用能的Python詞云圖代碼,什么是云計(jì)算?python是一種什么編程語(yǔ)言?云計(jì)算和python有什么關(guān)系?,如何用Python做詞云???。

1.Python點(diǎn)云數(shù)據(jù)處理(一)點(diǎn)云工具箱功能介紹

*篇知乎文章,在此記錄和分享研究生期間學(xué)習(xí)的一些內(nèi)容和成果。本篇文章將介紹通過(guò)Python語(yǔ)言自編的一個(gè)用于點(diǎn)云數(shù)據(jù)處理的軟件,軟件名為點(diǎn)云工具箱,版本V1.0。本文僅對(duì)軟件功能及實(shí)現(xiàn)效果進(jìn)行簡(jiǎn)要介紹,后面的文章將陸續(xù)推出部分功能實(shí)現(xiàn)原理和相關(guān)代碼分享等。內(nèi)容導(dǎo)視:簡(jiǎn)介主窗口工具欄文件工具濾波下采樣/關(guān)鍵點(diǎn)配準(zhǔn)重建關(guān)于一、簡(jiǎn)介點(diǎn)云工具箱是針對(duì)點(diǎn)云數(shù)據(jù)及曲面數(shù)據(jù)進(jìn)行處理的一個(gè)軟件,界面簡(jiǎn)約易于操作。該軟件支持強(qiáng)大的數(shù)據(jù)可視化功能,可視化通過(guò)軟件主窗口及可全屏子窗口兩種方式實(shí)現(xiàn)。支持常見(jiàn)點(diǎn)云數(shù)據(jù)和曲面數(shù)據(jù)的轉(zhuǎn)換保存,包含常見(jiàn)的點(diǎn)云濾波、點(diǎn)云下采樣及關(guān)鍵點(diǎn)獲取、曲面點(diǎn)采樣、點(diǎn)云粗配準(zhǔn)與精配準(zhǔn)算法、點(diǎn)云表面重建算法,能夠?yàn)閺氖曼c(diǎn)云數(shù)據(jù)研究和處理的人群提供一些方便實(shí)用的功能。軟件中的部分算法及可視化主要依賴于以下幾個(gè)第三方庫(kù):Pyqt5、Open3D、Vispy、。二、主窗口點(diǎn)擊進(jìn)入點(diǎn)云工具箱軟件后,顯示為軟件的主窗口。最上方為菜單欄包含軟件主要功能,下一行為常用的幾個(gè)工具欄圖標(biāo),“數(shù)據(jù)”框存放點(diǎn)云數(shù)據(jù)和曲面數(shù)據(jù)的名稱,點(diǎn)擊數(shù)據(jù)項(xiàng)可進(jìn)行選中并將數(shù)據(jù)的各項(xiàng)屬性顯示在下方的“屬性”框中,右側(cè)白色框?yàn)榭梢暬瘮?shù)據(jù)的主窗口,最下方顯示所有操作的記錄信息。三、工具欄工具欄圖標(biāo)在未讀入數(shù)據(jù)的情況下部分按鈕顯示為灰色狀態(tài)無(wú)法點(diǎn)擊,將圖標(biāo)從左向右依次編號(hào)為1-14,圖標(biāo)1和2為單個(gè)點(diǎn)云數(shù)據(jù)的讀取與保存,圖標(biāo)3關(guān)閉數(shù)據(jù),讀取數(shù)據(jù)后可通過(guò)屬性欄查看信息及“是否可視”選項(xiàng)控制可視化,畫(huà)面顯示窗口通過(guò)鼠標(biāo)滾輪進(jìn)行縮放,鼠標(biāo)左鍵單擊進(jìn)行旋轉(zhuǎn),“shift”+鼠標(biāo)左鍵單擊進(jìn)行平移,如下圖所示:圖標(biāo)4-6依次為背景色改變、數(shù)據(jù)顏色改變和點(diǎn)云大小改變,如下圖所示:圖標(biāo)7對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行均勻下采樣,圖標(biāo)8計(jì)算兩組點(diǎn)云的所有點(diǎn)最小距離之和(需選中兩組點(diǎn)云),圖標(biāo)9-14為子窗口展示數(shù)據(jù)的各方向視圖。四、文件菜單欄*項(xiàng)為“文件”,包括打開(kāi)、保存數(shù)據(jù)操作及關(guān)閉當(dāng)前所有文件和退出程序指令,支持的格式有.pcd、.txt、.asc、.ply和.obj,如下圖所示:五、工具菜單欄的“工具”項(xiàng)如下圖所示:“點(diǎn)云密度計(jì)算”功能可以計(jì)算出所有點(diǎn)離最近點(diǎn)的距離平均值,“添加高斯白噪聲”可以為點(diǎn)云添加指定強(qiáng)度的噪聲產(chǎn)生新的點(diǎn)云,如下圖所示:“點(diǎn)云歸一化”可以將點(diǎn)云數(shù)據(jù)的坐標(biāo)歸一化在-1~1范圍內(nèi),“計(jì)算兩點(diǎn)云RMSE”可以主要用于計(jì)算配準(zhǔn)后兩個(gè)點(diǎn)云之間的誤差,“切片”功能可以將數(shù)據(jù)中的一部分切割出來(lái)并進(jìn)行保存,具體操作如下圖所示:六、濾波“濾波”提供了幾種常見(jiàn)的點(diǎn)云濾波算法和一種基于RANSAC的平面分割算法,如下圖所示:6.1 孤點(diǎn)濾波“剔除無(wú)窮點(diǎn)”主要為點(diǎn)云剔除數(shù)據(jù)值異常的點(diǎn),包括非數(shù)值點(diǎn)和無(wú)窮值的點(diǎn),“孤點(diǎn)濾波”可以濾除偏離大部分點(diǎn)的孤立點(diǎn),如下圖所示:6.2 統(tǒng)計(jì)學(xué)濾波“統(tǒng)計(jì)學(xué)濾波”依據(jù)統(tǒng)計(jì)學(xué)原理剔除點(diǎn)云中偏離標(biāo)準(zhǔn)差倍數(shù)的點(diǎn),效果如下圖所示:6.3 RANSAC分割平面 “RANSAC分割平面”可以分割出點(diǎn)云中在同一平面的點(diǎn),例如可以將街道點(diǎn)云中的地面分割出來(lái),如下圖所示:七、下采樣/關(guān)鍵點(diǎn) 7.1 均勻下采樣“均勻下采樣”根據(jù)點(diǎn)與點(diǎn)之間的距離,每k個(gè)點(diǎn)中取一個(gè)點(diǎn),如此得到均勻采樣的點(diǎn)云,如下圖所示:7.2 體素下采樣“體素下采樣”將點(diǎn)云所處的空間均勻劃分為等大小的n個(gè)小立方體,每個(gè)小立方體中以中心點(diǎn)代替其中的所有點(diǎn)進(jìn)行下采樣。7.3 曲率下采樣 “曲率下采樣”與上述兩種采樣方式本質(zhì)上有所不同,該方法依據(jù)各點(diǎn)曲率的大小分配權(quán)值然后進(jìn)行采樣,曲率大的地方表面特征較為明顯,因此采樣點(diǎn)數(shù)多可以保留特征細(xì)節(jié),曲率小的地方采樣點(diǎn)數(shù)較少,由于該方法計(jì)算曲率耗時(shí),故在參數(shù)子窗口中放置一個(gè)進(jìn)度條顯示進(jìn)度,如下圖所示:7.4 曲面均勻采樣 “曲面均勻采樣”針對(duì)的曲面數(shù)據(jù)進(jìn)行操作,讀取曲面數(shù)據(jù)后,在數(shù)據(jù)的表面均勻采樣得到點(diǎn)云數(shù)據(jù),如下圖所示:7.5 曲面泊松磁盤(pán)采樣 “曲面泊松磁盤(pán)采樣”是一種采樣泊松分布算法進(jìn)行曲面采樣得到點(diǎn)云的方法,也是目前采樣較為穩(wěn)定使用較廣泛的一種算法。7.6 ISS關(guān)鍵點(diǎn) “ISS關(guān)鍵點(diǎn)”求出點(diǎn)云中特征明顯的點(diǎn),例如角點(diǎn)頂點(diǎn)等。八、配準(zhǔn) “配準(zhǔn)”功能需要先讀取用于配準(zhǔn)的兩組點(diǎn)云數(shù)據(jù),此處注意打開(kāi)多個(gè)點(diǎn)云時(shí)需要從“文件”->“打開(kāi)多個(gè)點(diǎn)云”方式打開(kāi),然后按住“Ctrl”鍵選中該兩組點(diǎn)云,再選擇需要進(jìn)行的配準(zhǔn)操作。8.1 粗配準(zhǔn)粗配準(zhǔn)提供了四種組合方式的配準(zhǔn)功能,如下圖所示:FPFH方法采用的是計(jì)算局部幾何特征的分布直方圖來(lái)求解對(duì)應(yīng)點(diǎn)并進(jìn)行粗配準(zhǔn),與之對(duì)應(yīng)的是DGNET基于神經(jīng)網(wǎng)絡(luò)的一種特征提取然后求解對(duì)應(yīng)點(diǎn)進(jìn)行粗配準(zhǔn);與上兩種方法相組合的分別是RANSAC和FAST算法,兩者區(qū)別在于FAST計(jì)算效率更高,而RANSAC適用性更為廣泛。在此僅展示“FPFH+FAST”和“DGNET+FAST”的效果圖,注意左邊存儲(chǔ)數(shù)據(jù)名稱框中命名規(guī)則對(duì)于產(chǎn)生的新點(diǎn)云均是以“原始文件名”+“產(chǎn)生方法的縮寫(xiě)”構(gòu)成,如下所示:8.2 ICP精配準(zhǔn) “ICP精配準(zhǔn)”算法此處提供“點(diǎn)到點(diǎn)”和“點(diǎn)到面”兩種計(jì)算方式,ICP算法也是目前使用較為廣泛的一種精配準(zhǔn)算法,該功能將點(diǎn)云精配準(zhǔn)后的重疊率和誤差顯示與控制臺(tái)中,如下圖所示:8.3 動(dòng)態(tài)ICP“動(dòng)態(tài)ICP”方法為上小節(jié)中ICP點(diǎn)到面方法的演變方法,該方法特色為支持較大誤差點(diǎn)云的配準(zhǔn)(傳統(tǒng)ICP算法在兩點(diǎn)云初始位置相差較大時(shí)不能成功配準(zhǔn),往往需要預(yù)先進(jìn)行粗配準(zhǔn)),同時(shí)支持在子窗口動(dòng)態(tài)顯示配準(zhǔn)過(guò)程,如下圖所示:九、重建 9.1 Delaunay曲面重建該功能主要依賴于三維Delaunay三角剖分算法,先將點(diǎn)云數(shù)據(jù)劃分為n個(gè)四面體,然后依據(jù)三角形劃分規(guī)則從中選出合適的三角形,轉(zhuǎn)換得到點(diǎn)云的曲面形式,如下圖所示:9.2 Poisson曲面重建Poisson曲面重建來(lái)源于Poisson算法,是目前點(diǎn)云構(gòu)建曲面的一種較為常用的算法,通過(guò)構(gòu)建泊松隱式函數(shù)來(lái)逼近于點(diǎn)云得到精確曲面,功能中的深度參數(shù)可以控制逼近程度。十、關(guān)于后續(xù)內(nèi)容持續(xù)更新,歡迎點(diǎn)贊收藏關(guān)注三連~~~

2.Python生成詞云圖太簡(jiǎn)單了|拿來(lái)就用能的Python詞云圖代碼

詞云也叫文字云,是一種可視化的結(jié)果呈現(xiàn),常用在爬蟲(chóng)數(shù)據(jù)分析中,原理就是統(tǒng)計(jì)文本中高頻出現(xiàn)的詞,過(guò)濾掉某些干擾詞,將結(jié)果生成一張圖片,直觀的獲取數(shù)據(jù)的重點(diǎn)信息。今天,我們就來(lái)學(xué)習(xí)一下Python生成詞云的常用庫(kù)「wordcloud」?!赴惭b」:pip install 項(xiàng)目: install 有三種分詞模式,這里我們只學(xué)習(xí)它的精確模式,把文本精確的切分開(kāi),不存在冗余單詞。使用jieba.lcut(s),返回列表型分詞結(jié)果。當(dāng)然,也可以使用jieba.add_word(w)向jieba庫(kù)中增加詞語(yǔ)。詞云案例爬取最近很火的一部電影《你好,李煥英 》的影評(píng)數(shù)據(jù),生成詞云。「獲取10頁(yè)短評(píng)數(shù)據(jù),保存到文本中。」import requests from bs4 import import time import random urls=[' for i in range(0, 200, 20)] #通過(guò)觀察的url翻頁(yè)的規(guī)律,使用for循環(huán)得到10個(gè)鏈接,保存到urls列表中 print(urls) dic_h = { "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) /537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"} comments_list = [] #初始化用于保存短評(píng)的列表 for url in urls: #使用for循環(huán)分別獲取每個(gè)頁(yè)面的數(shù)據(jù),保存到comments_list列表 r = requests.get(url=url,headers = dic_h).text soup = (r, 'lxml') ul = soup.find('div',id="comments") lis= ul.find_all('p') list2 =[] for li in lis: list2.append(li.find('span').string) # print(list2) comments_list.extend(list2) time.sleep(random.randint(0,3)) # 暫停0~3秒 with open('lhy_comments.txt', 'w', encoding='utf-8') as f: #使用with open()新建對(duì)象f # 將列表中的數(shù)據(jù)循環(huán)寫(xiě)入到文本文件中 for i in comments_list: f.write(i+"\n") #寫(xiě)入數(shù)據(jù) 使用wordcloud生成詞云的步驟「1.讀取文件,分詞整理」「2.配置對(duì)象參數(shù),加載詞云文本」「3.計(jì)算詞頻,輸出詞云文件」基本的詞云import jieba import wordcloud # 讀取文本 with open("lhy_comments.txt",encoding="utf-8") as f: s = f.read() print(s) ls = jieba.lcut(s) # 生成分詞列表 text = ' '.join(ls) # 連接成字符串 stopwords = ["的","是","了"] # 去掉不需要顯示的詞 wc = wordcloud.WordCloud(font_path="msyh.ttc", width = 1000, height = 700, _color='white', max_words=100,stopwords=s) # msyh.ttc電腦本地字體,寫(xiě)可以寫(xiě)成絕對(duì)路徑 wc.generate(text) # 加載詞云文本 wc.to_file("李煥英1.png") # 保存詞云文件 詞云效果如下:添加蒙版圖片的詞云可以將有白色背景的圖片作為蒙版圖片,有圖案的地方會(huì)被詞云填充。添加蒙版圖片需要使用PIL,numpy庫(kù)。添加蒙版圖片如下:# 示例代碼 from wordcloud import WordCloud from PIL import Image import numpy as np import .pyplot as plt import jieba # 打開(kāi)文本 with open("lhy_comments.txt",encoding="utf-8") as f: s = f.read() # 中文分詞 text = ' '.join(jieba.cut(s)) # 生成對(duì)象 img = Image.open("mask_pic.png") # 打開(kāi)遮罩圖片 mask = np.array(img) #將圖片轉(zhuǎn)換為數(shù)組 stopwords = ["我","你","她","的","是","了","在","也","和","就","都","這"] wc = WordCloud(font_path="msyh.ttc", mask=mask, width = 1000, height = 700, _color='white', max_words=200, stopwords=stopwords).generate(text) # 顯示詞云 plt.imshow(wc, ='bilinear')# 用plt顯示圖片 plt.axis("off") # 不顯示坐標(biāo)軸 plt.show() # 顯示圖片 # 保存到文件 wc.to_file("李煥英2.png") 詞云效果如下:拿來(lái)就用能的Python詞云圖代碼|wordcloud生成詞云詳解

3.什么是云計(jì)算?python是一種什么編程語(yǔ)言?云計(jì)算和python有什么關(guān)系?

云計(jì)算,Cloud computing?;诨ヂ?lián)網(wǎng)的超級(jí)計(jì)算模式。即把存儲(chǔ)于個(gè)人電腦、移動(dòng)電話和其他設(shè)備上的大量信息和處理器資源集中在一起,協(xié)同工作。云計(jì)算它是一種新興的共享基礎(chǔ)架構(gòu)的方法,可以將巨大的系統(tǒng)池連接在一起以提供各種IT服務(wù)。很多因素推動(dòng)了對(duì)這類(lèi)環(huán)境的需求,其中包括連接設(shè)備、實(shí)時(shí)數(shù)據(jù)流、SOA的采用以及搜索、開(kāi)放協(xié)作、社會(huì)網(wǎng)絡(luò)和移動(dòng)商務(wù)等這樣的Web 2.0應(yīng)用的急劇增長(zhǎng)。 另外,數(shù)字元器件性能的提升也使IT環(huán)境的規(guī)模大幅度提高,從而進(jìn)一步加強(qiáng)了對(duì)一個(gè)由統(tǒng)一的云進(jìn)行管理的需求。 云理論是實(shí)現(xiàn)概念的定性值與數(shù)字的定量值之間自然轉(zhuǎn)換的有力工具.本文在云理論的基礎(chǔ)上,提出了實(shí)現(xiàn)概念計(jì)算(也叫簡(jiǎn)化計(jì)算)的云計(jì)算方法.概述了云模型與不確定推理;給出了計(jì)算的邏輯描述,將計(jì)算過(guò)程抽象成為推理過(guò)程;運(yùn)用機(jī)器學(xué)習(xí)的方法,給出了計(jì)算云化的過(guò)程,并且采用不確定推理的方法,給出了云的計(jì)算過(guò)程;簡(jiǎn)單闡述了云化計(jì)算的系統(tǒng)實(shí)現(xiàn).

4.如何用Python做詞云?

臨淵羨魚(yú),不如退而結(jié)網(wǎng)。我們步步為營(yíng),從頭開(kāi)始幫助你用Python做出*張?jiān)~云圖來(lái)。歡迎嘗試哦!需求在大數(shù)據(jù)時(shí)代,你經(jīng)常可以在媒體或者網(wǎng)站上看到一些非常漂亮的信息圖。例如這個(gè)樣子。或是這個(gè)樣子的??催^(guò)之后你有什么感覺(jué)?想不想自己做一張出來(lái)?如果你的答案是肯定的,我們就不要拖延了,今天就來(lái)一步步從零開(kāi)始做個(gè)詞云分析圖。當(dāng)然,做為基礎(chǔ)的詞云圖,肯定比不上剛才那兩張信息圖酷炫。不過(guò)不要緊,好的開(kāi)始是成功的一半嘛。食髓知味,后面你就可以自己升級(jí)技能,進(jìn)入你開(kāi)掛的成功之路。網(wǎng)上教你做信息圖的教程很多。許多都是利用了專(zhuān)用工具。這些工具好是好,便捷而強(qiáng)大。只是它們功能都太過(guò)專(zhuān)一,適用范圍有限。今天我們要嘗試的,是用通用的編程語(yǔ)言Python來(lái)做詞云。Python是一種時(shí)下很流行的編程語(yǔ)言。你不僅可以用它做數(shù)據(jù)分析和可視化,還能用來(lái)做網(wǎng)站、爬取數(shù)據(jù)、做數(shù)學(xué)題、寫(xiě)腳本替你偷懶……知道豆瓣嗎?它一開(kāi)始就是用Python寫(xiě)的。在目前的編程語(yǔ)言熱度排序里,Python屈居第四(當(dāng)然,很多人不同意,所以編程語(yǔ)言的排行榜有許多,你懂的)。但看問(wèn)題要用發(fā)展眼光。隨著數(shù)據(jù)科學(xué)的發(fā)展,Python有爆發(fā)的趨勢(shì)。早點(diǎn)兒站上風(fēng)口,很有益處。如果你之前沒(méi)有編程基礎(chǔ),沒(méi)關(guān)系。從零開(kāi)始,意味著我會(huì)教你如何安裝Python運(yùn)行環(huán)境,一步步完成詞云圖。希望你不要限于瀏覽,而是親自動(dòng)手嘗試一番。到完成的那一步,你不僅可以做出*張?jiān)~云圖,而且這還將是你的*個(gè)有用的編程作品。心動(dòng)了?那咱們就開(kāi)始吧。安裝首先,我們需要安裝Python運(yùn)行環(huán)境。如果你用的是macOS,那么你的系統(tǒng)里面實(shí)際已經(jīng)預(yù)裝好了Python。然而我們要使用到許多擴(kuò)展包的功能。因此*安裝一個(gè)Python工具套裝。只需要一次安裝,以后大部分的功能就都已集成了。不必每次使用新功能,都去零敲碎打地安裝新包了。Python的套裝有許多種,這里推薦給大家anaconda。因?yàn)榻?jīng)過(guò)我4年多的嘗試與對(duì)比,感覺(jué)這款軟件包的安裝更為便捷,擴(kuò)展包的涵蓋范圍與結(jié)構(gòu)更合理。請(qǐng)你到 這個(gè)網(wǎng)址 下載anaconda套裝。下拉網(wǎng)頁(yè)找到下載位置。根據(jù)你的操作系統(tǒng)類(lèi)型選擇合適的版本。因?yàn)槲业南到y(tǒng)是macOS,所以網(wǎng)站直接給我推薦的就是macOS系統(tǒng)版本。但如果你用的是Windows或Linux,請(qǐng)切換到相應(yīng)的標(biāo)簽頁(yè)上面。不管你用的是哪個(gè)操作系統(tǒng),請(qǐng)注意右側(cè)的兩個(gè)按鈕,分別對(duì)應(yīng)Python 2.X和3.X版本。有人一定很納悶,既然有新的版本,我憑什么用舊的?不是這樣的。到2021年之前,Python的兩個(gè)版本會(huì)一直并存。Python的開(kāi)發(fā)者確實(shí)希望大家升級(jí)切換到3.X版本??上壳?.X版本兼容的擴(kuò)展包數(shù)量比2.X版本要少,尤其是涉及到數(shù)據(jù)科學(xué)類(lèi)的軟件包,就尤其明顯。所以如果你是初學(xué)者,我建議你下載2.X(目前是2.7)版本,這樣在以后的使用中,可能遇到的問(wèn)題會(huì)少一些。等你運(yùn)用熟練了,再遷移到3.X版本不遲。相信我,到那時(shí)你會(huì)很快適應(yīng)新版本的。下載后,執(zhí)行安裝文件就行了。根據(jù)你的電腦運(yùn)行速度不同,安裝的時(shí)間長(zhǎng)短不等。耐心點(diǎn)兒,只需要等這一次嘛。安裝完畢之后,請(qǐng)你安裝一個(gè)“現(xiàn)代化”瀏覽器。如果你用的是macOS,那么系統(tǒng)自帶的Safari就挺好。其他的選擇包括Firefox和Google Chrome。請(qǐng)安裝上述瀏覽器之一,然后將其設(shè)置為系統(tǒng)默認(rèn)的瀏覽器。好了,下面請(qǐng)進(jìn)入命令行模式。在macOS和Linux下,你需要開(kāi)啟一個(gè)終端(terminal)。如果是Windows,請(qǐng)打開(kāi)“開(kāi)始”-“附件”-“命令提示符”。鍵入以下命令:mkdir demo cd demo 好了,你現(xiàn)在有一個(gè)專(zhuān)用的目錄,叫做demo了。請(qǐng)到macOS的Finder或者Windows的“我的電腦”里面,找到這個(gè)目錄并且打開(kāi)它?;氐浇K端下面,macOS或者Linux用戶請(qǐng)鍵入以下命令:pip install wordcloud macOS會(huì)提示你先安裝XCode命令行工具,你按照默認(rèn)設(shè)置一步步進(jìn)行就可以了。但是請(qǐng)注意,務(wù)必在WiFi環(huán)境下安裝。如果你用的是4G流量,那你可要破費(fèi)一筆了。如果你用的是Windows,那么為了使用這個(gè)詞云包,就稍微麻煩一些,你需要到 這里 下載 wordcloud?1.3.1?cp27?cp27m?win32.whl 這個(gè)文件。下載后將它拖拽到你的demo目錄里。在命令行下,先執(zhí)行:pip install wheel 然后,再執(zhí)行:pip install wordcloud?1.3.1?cp27?cp27m?win32.whl 好了,我們需要的全部Python運(yùn)行環(huán)境終于裝好了。請(qǐng)務(wù)必按照上述步驟執(zhí)行,確保每一步都已經(jīng)順利完成。否則一旦遺漏,后面運(yùn)行程序會(huì)報(bào)錯(cuò)。數(shù)據(jù)詞云分析的對(duì)象,是文本。理論上講,文本可以是各種語(yǔ)言的。英文、中文、法文、阿拉伯文……為了簡(jiǎn)便,我們這里以英文文本為例。你可以隨意到網(wǎng)上找一篇英文文章作為分析對(duì)象。我特別喜歡英劇”Yes, minister”,所以到維基百科上找到了這部劇的介紹詞條。我把其中的正文文字部分拷貝了下來(lái),存儲(chǔ)為一個(gè)文本文件,叫做yes-minister.txt。把這個(gè)文件挪動(dòng)到我們的工作目錄demo里。好了,文本數(shù)據(jù)已經(jīng)準(zhǔn)備好了。開(kāi)始進(jìn)入編程的魔幻世界吧!代碼在命令行下,執(zhí)行:jupyter notebook 瀏覽器會(huì)自動(dòng)開(kāi)啟,并且顯示如下界面。這就是咱們剛才的勞動(dòng)成果——安裝好的運(yùn)行環(huán)境了。我們還沒(méi)有編寫(xiě)程序,目錄下只有一個(gè)剛才生成的文本文件。打開(kāi)這個(gè)文件,瀏覽一下內(nèi)容?;氐絁upyter筆記本的主頁(yè)面。我們點(diǎn)擊New按鈕,新建一個(gè)筆記本(Notebook)。在Notebooks里面,請(qǐng)選擇Python 2選項(xiàng)。系統(tǒng)會(huì)提示我們輸入Notebook的名稱。程序代碼文件的名稱,你可以隨便起。但是我建議你起一個(gè)有意義的名字,將來(lái)好方便查找。由于我們要嘗試詞云,就叫它wordcloud好了。然后就出現(xiàn)了一個(gè)空白的筆記本,供我們使用了。我們?cè)诰W(wǎng)頁(yè)里*的代碼文本框里,輸入以下3條語(yǔ)句。請(qǐng)務(wù)必逐字根據(jù)示例代碼輸入,空格數(shù)量都不可以有差別。尤其注意第三行,用4個(gè)空格,或者1個(gè)Tab開(kāi)始。輸入后,按Shift+Enter鍵,就可以執(zhí)行了。filename = "yes-minister.txt" with open(filename) as f: mytext = f.read() 沒(méi)有任何結(jié)果啊。對(duì),因?yàn)槲覀冞@里沒(méi)有任何輸出動(dòng)作,程序只是打開(kāi)了你的yes-minister.txt文本文件,把里面的內(nèi)容都讀了出來(lái),存儲(chǔ)到了一個(gè)叫做mytext的變量里面。然后我們嘗試顯示mytext的內(nèi)容。輸入以下語(yǔ)句之后,還是得按Shift+Enter鍵,系統(tǒng)才會(huì)實(shí)際執(zhí)行該語(yǔ)句。mytext 之后的步驟里,也千萬(wàn)不要忘了這一確認(rèn)執(zhí)行動(dòng)作。顯示的結(jié)果如下圖所示。嗯,看來(lái)mytext變量里存儲(chǔ)的文本就是我們從網(wǎng)上摘來(lái)的文字。到目前為止,一切正常。然后我們呼喚(import)詞云包,利用mytext中存儲(chǔ)的文本內(nèi)容來(lái)制造詞云。from wordcloud import WordCloud wordcloud = WordCloud().generate(mytext) 這時(shí)程序可能會(huì)報(bào)警。別擔(dān)心。警告(warning)不影響程序的正常運(yùn)行。此時(shí)詞云分析已經(jīng)完成了。你沒(méi)看錯(cuò),制作詞云的核心步驟只需要這2行語(yǔ)句,而且*條還只是從擴(kuò)展包里找外援。但是程序并不會(huì)給我們顯示任何東西。說(shuō)好了的詞云呢?折騰了這么半天,卻啥也沒(méi)有,你蒙人嗎?!別激動(dòng)。輸入下面4行語(yǔ)句后,就是見(jiàn)證奇跡發(fā)生的時(shí)刻了。%pylab inline import .pyplot as plt plt.imshow(wordcloud, ='bilinear') plt.axis("off") 運(yùn)行結(jié)果如圖所示:不用那么興奮嘛。你可以在詞云圖片上單機(jī)鼠標(biāo)右鍵,用“圖片另存為”功能導(dǎo)出。通過(guò)這張?jiān)~云圖,我們可以看到不同單詞和詞組出現(xiàn)的頻率高低差別。高頻詞的字體明顯更大,而且顏色也很醒目。值得說(shuō)明的是,最顯眼的單詞Hacker并不是指黑客,而是指這部劇的主角之一——哈克首相。包含程序完整代碼的ipynb文件,我也分享了出來(lái),你可以從 這里 下載。希望你在嘗試過(guò)程中一切順利。對(duì)自己生成的詞云圖滿意嗎?如果你不滿意,也不要緊,可以挖掘wordcloud軟件包的其他高級(jí)功能。嘗試一下,看自己能不能做出這樣的詞云圖來(lái)?討論學(xué)完了本方法后,你做出了一張什么樣的詞云圖?除了本文介紹的方法以外,你還知道哪些便捷地制作詞云或其他信息圖的方式?歡迎留言,分享給大家。我們共同交流討論。如果你對(duì)我的文章感興趣,歡迎點(diǎn)贊,并且微信關(guān)注和置頂我的公眾號(hào)“玉樹(shù)芝蘭”()。如果本文可能對(duì)你身邊的親友有幫助,也歡迎你把本文通過(guò)微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來(lái)。

就拿大數(shù)據(jù)說(shuō)話,優(yōu)勢(shì)一目了然,從事IT行業(yè),打開(kāi)IT行業(yè)的新大門(mén),找到適合自己的培訓(xùn)機(jī)構(gòu),進(jìn)行專(zhuān)業(yè)和系統(tǒng)的學(xué)習(xí)。

本文由 全國(guó)python學(xué)習(xí)中心 整理發(fā)布。更多培訓(xùn)課程,學(xué)習(xí)資訊,課程優(yōu)惠,課程開(kāi)班,學(xué)校地址等學(xué)校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細(xì)解答:
咨詢電話:400-850-8622

如果本頁(yè)不是您要找的課程,您也可以百度查找一下:
相關(guān)文章