呆板学习数据库下载并显示至少一个图像和一个文档数据集

缺个真心人

图象数据散：
Task1：正在机械进修库中寻觅图象散并下载。
正在寻觅的过程当中发明网站内乱的图象散较少，年夜多为文档散。此处经由过程百度搜刮UCI机械进修数据散，终极找到图象数据散，链接以下。
http://archive.ics.uci.edu/ml/machine-learning-databases/faces-mld/
下载此中的紧缩包——faces.tar.gz
Task2： 显现图象数据散
① 随便选三小我私家，每一个人与三张照片。将那些照片同一放到一个文件夹中，筹办读与。
② 可是正在法式运转时却没法分辨照片。毛病：PIL.UnidentifiedImageError: cannot identify image file 'pictures/at33_left_angry_open.pgm' 。查询材料后，将文件后缀改成txt举办检察，发明该图片本为P2形式的pgm文件，没法用PIL的方法读与。处理无果下决议从头挑选图片。
③ 经由过程定位网页中的枢纽词“图象”，寻觅适宜的图象散。觅得以下链接：
http://archive.ics.uci.edu/ml/machine-learning-databases/CorelFeatures-mld/
③ 运转代码：

import PIL.Image as Image
import os
#图片拼接（九宫图）
def join_pictures():
path='pictures/'
size=256 #每张小图片的巨细
format=['.jpg'] #图片格局
n=3
row=n #止数
col=n #列数
image_names=[name for name in os.listdir(path) for item in format if
os.path.splitext(name)[1] == item]
# 创立新图
new_picture=Image.new('RGB',(col*size,row*size))
# 遍历将旧图揭到对应地位
for i in range(0,row):
for j in range(0,col):
old_picture=Image.open(path+image_names[col*i+j]).resize((size,size),Image.ANTIALIAS)
new_picture.paste(old_picture,(j*size,i*size))
return new_picture.save('D:\\ML\\first\\result.jpg') # 保留新图
join_pictures()

复造代码

④ 结果展现：

正在网页中寻觅其他图片举办拼接，获得以下九宫格：

文档数据散：
Task1：正在机械进修库中寻觅文档散并下载。
文档数据散寻觅较为便利。那里挑选 Iris Data Set 中的 iris.data 举办下载，修正文件规范为文本文档。链接以下：
http://archive.ics.uci.edu/ml/machine-learning-databases/iris/
文件中的数据别离为：

sepal length in cm	花萼少度，单元cm
sepal width in cm	花萼宽度，单元cm
petal length in cm	花瓣少度，单元cm
petal width in cm	花瓣宽度，单元cm
class	品种： Iris Setosa/ Iris Versicolour / Iris Virginic

Task2：展现文档数据集合两两特性之间的干系（部门）
① 运转代码：

import pandas as pd
import matplotlib.pyplot as plt
#转化为dataframe格局
iris_data = pd.read_table('iris.txt',header=None,sep=',')
#print(iris_data.shape[0])
#为差别品种iris设置色彩停止辨别
Colors = []
for i in range(iris_data.shape[0]):
m = iris_data.iloc[i,-1]
if m=='Iris-setosa':
Colors.append('green')
elif m=='Iris-versicolor':
Colors.append('purple')
elif m=='Iris-virginica':
Colors.append('red')
#画图
plt.subplot(1,2,1)
plt.scatter(iris_data.iloc[:,0],iris_data.iloc[:,1],c=Colors,edgecolors='black')
plt.xlabel("sepal length")
plt.ylabel("sepal width")
plt.subplot(1,2,2)
plt.scatter(iris_data.iloc[:,0],iris_data.iloc[:,2],c=Colors,edgecolors='black')
plt.xlabel("sepal length")
plt.ylabel("petal length")
plt.show()

复造代码

② 结果展现：

经由过程集面图检察文档数据集合的数据，能够较为分明天看出数据之间的联系关系性。
如：Iris-setosa 的sepal length 集合正在（0，6），而petal length 集合正在（1，2），当一只iris同时合意那两个前提时，很年夜多是属于setosa的种类。

参考材料：
https://blog.csdn.net/ahaotata/article/details/84027000 Python将多张图片举办兼并
https://bbs.csdn.net/topics/397511449?list=lz pd.read_table读与文本文件时的分开符成绩
http://archive.ics.uci.edu/ml/index.php 机械进修数据库

免责声明：假如进犯了您的权益，请联络站少，我们会实时删除侵权内乱容，感谢协作！

呆板学习数据库下载并显示至少一个图像和一个文档数据集

浏览过的版块