呆板学习数据库下载并显示至少一个图像和一个文档数据集

代码 代码 1686 人阅读 | 0 人回复

<
图象数据散:
   Task1:正在机械进修库中寻觅图象散并下载。
        正在寻觅的过程当中发明网站内乱的图象散较少,年夜多为文档散。此处经由过程百度搜刮UCI机械进修数据散,终极找到图象数据散,链接以下。
       http://archive.ics.uci.edu/ml/machine-learning-databases/faces-mld/
        下载此中的紧缩包——faces.tar.gz
   Task2: 显现图象数据散
         ① 随便选三小我私家,每一个人与三张照片。将那些照片同一放到一个文件夹中,筹办读与。
         ② 可是正在法式运转时却没法分辨照片。毛病:PIL.UnidentifiedImageError: cannot identify image file &#39;pictures/at33_left_angry_open.pgm&#39; 。查询材料后,将文件后缀改成txt举办检察,发明该图片本为P2形式的pgm文件,没法用PIL的方法读与。处理无果下决议从头挑选图片。
         ③ 经由过程定位网页中的枢纽词“图象”,寻觅适宜的图象散。觅得以下链接:
        http://archive.ics.uci.edu/ml/machine-learning-databases/CorelFeatures-mld/
         ③ 运转代码:
  1. import PIL.Image as Image
  2. import os
  3. #图片拼接(九宫图)
  4. def join_pictures():
  5.     path=&#39;pictures/&#39;  
  6.     size=256  #每张小图片的巨细
  7.     format=[&#39;.jpg&#39;]  #图片格局
  8.     n=3
  9.     row=n  #止数
  10.     col=n  #列数
  11.     image_names=[name for name in os.listdir(path) for item in format if
  12.                  os.path.splitext(name)[1] == item]
  13.     # 创立新图
  14.     new_picture=Image.new(&#39;RGB&#39;,(col*size,row*size))
  15.     # 遍历将旧图揭到对应地位
  16.     for i in range(0,row):
  17.         for j in range(0,col):
  18.             old_picture=Image.open(path+image_names[col*i+j]).resize((size,size),Image.ANTIALIAS)
  19.             new_picture.paste(old_picture,(j*size,i*size))
  20.     return new_picture.save(&#39;D:\\ML\\first\\result.jpg&#39;)  # 保留新图
  21. join_pictures()
复造代码
         ④ 结果展现:
         
155349s7nngagz517q74g6.jpg

           正在网页中寻觅其他图片举办拼接,获得以下九宫格:
          
155349fbm5qigi1bq1bgi1.jpg


文档数据散:
    Task1:正在机械进修库中寻觅文档散并下载。
         文档数据散寻觅较为便利。那里挑选 Iris Data Set 中的 iris.data 举办下载,修正文件规范为文本文档。链接以下:
         http://archive.ics.uci.edu/ml/machine-learning-databases/iris/
          文件中的数据别离为:
               sepal length in cm              花萼少度,单元cm
sepal width in cm花萼宽度,单元cm
petal length in cm花瓣少度,单元cm
petal width in cm花瓣宽度,单元cm
class
品种: Iris Setosa/

 Iris Versicolour / Iris Virginic

   Task2:展现文档数据集合两两特性之间的干系(部门)
        ① 运转代码:
  1. import pandas as pd
  2. import matplotlib.pyplot as plt
  3. #转化为dataframe格局
  4. iris_data = pd.read_table(&#39;iris.txt&#39;,header=None,sep=&#39;,&#39;)
  5. #print(iris_data.shape[0])
  6. #为差别品种iris设置色彩停止辨别
  7. Colors = []
  8. for i in range(iris_data.shape[0]):
  9.     m = iris_data.iloc[i,-1]
  10.     if m==&#39;Iris-setosa&#39;:
  11.         Colors.append(&#39;green&#39;)
  12.     elif m==&#39;Iris-versicolor&#39;:
  13.         Colors.append(&#39;purple&#39;)
  14.     elif m==&#39;Iris-virginica&#39;:
  15.         Colors.append(&#39;red&#39;)
  16. #画图
  17. plt.subplot(1,2,1)
  18. plt.scatter(iris_data.iloc[:,0],iris_data.iloc[:,1],c=Colors,edgecolors=&#39;black&#39;)
  19. plt.xlabel("sepal length")
  20. plt.ylabel("sepal width")
  21. plt.subplot(1,2,2)
  22. plt.scatter(iris_data.iloc[:,0],iris_data.iloc[:,2],c=Colors,edgecolors=&#39;black&#39;)
  23. plt.xlabel("sepal length")
  24. plt.ylabel("petal length")
  25. plt.show()
复造代码
         ② 结果展现:
155350v31366o3kzqktq3b.jpg

           经由过程集面图检察文档数据集合的数据,能够较为分明天看出数据之间的联系关系性。
 如:Iris-setosa 的sepal length 集合正在(0,6),而petal length 集合正在(1,2),当一只iris同时合意那两个前提时,很年夜多是属于setosa的种类。



参考材料:
https://blog.csdn.net/ahaotata/article/details/84027000   Python将多张图片举办兼并
https://bbs.csdn.net/topics/397511449?list=lz  pd.read_table读与文本文件时的分开符成绩
http://archive.ics.uci.edu/ml/index.php    机械进修数据库
          



免责声明:假如进犯了您的权益,请联络站少,我们会实时删除侵权内乱容,感谢协作!
1、本网站属于个人的非赢利性网站,转载的文章遵循原作者的版权声明,如果原文没有版权声明,按照目前互联网开放的原则,我们将在不通知作者的情况下,转载文章;如果原文明确注明“禁止转载”,我们一定不会转载。如果我们转载的文章不符合作者的版权声明或者作者不想让我们转载您的文章的话,请您发送邮箱:Cdnjson@163.com提供相关证明,我们将积极配合您!
2、本网站转载文章仅为传播更多信息之目的,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证信息的正确性和完整性,且不对因信息的不正确或遗漏导致的任何损失或损害承担责任。
3、任何透过本网站网页而链接及得到的资讯、产品及服务,本网站概不负责,亦不负任何法律责任。
4、本网站所刊发、转载的文章,其版权均归原作者所有,如其他媒体、网站或个人从本网下载使用,请在转载有关文章时务必尊重该文章的著作权,保留本网注明的“稿件来源”,并自负版权等法律责任。
回复 关闭延时

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则