本文摘要:我们早已在之前的一篇文章中探究了神经网络和深度自学技术,现在是时候辩论深度自学的另一个主要组成部分了:数据,即图像,视频,电子邮件,驾驶员模式,短语,物体等等。
我们早已在之前的一篇文章中探究了神经网络和深度自学技术,现在是时候辩论深度自学的另一个主要组成部分了:数据,即图像,视频,电子邮件,驾驶员模式,短语,物体等等。令人吃惊的是,尽管我们的世界完全被数据所水淹,但相当大一部分是予以标示并未被整理过的,这意味著这些数据对于大多数目前的监督式自学来说是不能用的。而深度自学特别是在依赖大量较好的、结构化的、有标签的数据。
在我们“神经网络非数理化指南”的第二部分中,我们将研究为什么高质量的、标记过的数据如此最重要,它来自哪里,如何用于,以及近期不会有什么样的解决方案可以获取给我们生产的那些渴求自学的机器。监督自学:让我握你的手在关于神经网络的文章中,我们曾说明了如何通过精心制作的“香肠印刷机”(sausagepress)将数据输出给机器,这些印刷机需要较慢展开剖析、分析甚至自我提炼。这一过程被指出是监督式自学,因为大量的数据被输出到机器中,这些数据被事前煞费苦心地贴上了标签。
例如,要训练一个神经网络来辨识苹果或橙子的图片,就必须给这些图片贴上标签。机器可以通过辨识所有被标记为苹果或橙色的图片来解读数据,这些图片有共同之处,因此机器最后可以利用这些已辨识的图片来更加精确地预测新的图像中所经常出现的内容。他们看见的标记数据就越多,看见的数据集越大,就能更佳地促进他们预测的准确性。
这种方法在教教机器学习视觉数据时很简单,还可以教教机器如何辨识从照片、视频到图形和书写在内的东西。一个显著的优势是,在许多应用程序中,机器在图像识别上做到得甚至比人类就让。比如,Facebook的深度自学软件需要将一张陌生人的两张照片展开给定,其准确性与人类非常(实质上97%的情况下要好于人类),而谷歌在今年早些时候发售了一种可以从医学影像中观测肿瘤的神经网络,它的准确性甚至低于医师。
无监督自学:不必须监护人指导就得出结论如你所预期,与监督式自学比较不应的是无监督自学。这是所指你用力系由在机器上的皮带,让它藏身数据中,自律地展开找到和体验,找寻模式和联系,并得出结论,而不必须监护人的指导。
本文来源:澳门最新网站游戏-www.517bst.com