<?xml version="1.0" encoding="utf-8" ?><rss version="2.0"><channel><title>Bing: Dataset Enhancement Process Batch Processing</title><link>http://www.bing.com:80/search?q=Dataset+Enhancement+Process+Batch+Processing</link><description>Search results</description><image><url>http://www.bing.com:80/s/a/rsslogo.gif</url><title>Dataset Enhancement Process Batch Processing</title><link>http://www.bing.com:80/search?q=Dataset+Enhancement+Process+Batch+Processing</link></image><copyright>Copyright © 2026 Microsoft. All rights reserved. These XML results may not be used, reproduced or transmitted in any manner or for any purpose other than rendering Bing results within an RSS aggregator for your personal, non-commercial use. Any other use of these results requires express written permission from Microsoft Corporation. By accessing this web page or using these results in any manner whatsoever, you agree to be bound by the foregoing restrictions.</copyright><item><title>在看一些论文中经常遇到，data set 与 dataset ，那请问这二者的区别在哪里? - 知乎</title><link>https://www.zhihu.com/question/314502626</link><description>dataset未出现在任何词典中。 然而，在当代美国英语语料库中有172例，大部分都出现在“学术”部分，这意味着dataset是一种正式的学术写作。 它之所以没有出现在词典中，可能是因为它是一种新创词语。 而从2001年起，美国历史英语语料库中出现了两例。</description><pubDate>Thu, 02 Apr 2026 16:08:00 GMT</pubDate></item><item><title>Pytorch中的Dataset 和 DataLoader起什么作用？ - 知乎</title><link>https://www.zhihu.com/question/570770126</link><description>pytorch的Dataset和DataLoader为迭代训练过程提供数据加载（包括数据增强部分）等任务。 重载的Dataset类里的两个关键函数 __len__ 、 __getitem__ 是一般需要重写 (override)。其中__len__方法返回数据集的长度，__getitem__方法实现返回样本数据集的一条数据 (包括label标注数据)，__getitem__可以让对象实现迭代功能 ...</description><pubDate>Mon, 23 Mar 2026 22:25:00 GMT</pubDate></item><item><title>模仿学习 (Imitation Learning)入门指南</title><link>https://www.zhihu.com/tardis/bd/art/140348314</link><description>模仿学习的思想很直观 (intuitive)。我们在前面所介绍的Model-free, Model-based强化学习方法都是 从零开始 (from scratch) 探索并学习一个使累计回报最大的策略 (policy) 。 Imitation Learning的想法是，借助人类给出的示范 (demonstration)，可以快速地达到这个目的。这个示范是多组trajectory轨迹数据 ， 每条轨迹包含 ...</description><pubDate>Thu, 02 Apr 2026 23:39:00 GMT</pubDate></item><item><title>加载数据集的时候经常用到def __getitem__ (self, index):具体怎么理解它呢？ - 知乎</title><link>https://www.zhihu.com/question/443036026</link><description>2.我是使用DataLoader加载数据集的，这其中有batch_size,这意味着必然要对所有数据经行分开打包，所以一定是使用了 dataset [index] 中所有的index,所以 __getitem__ 有了所有的index。 shuffle是用来旋转数据是否随机打包的，可以通过调它的布尔值验证，见下图。</description><pubDate>Thu, 02 Apr 2026 20:19:00 GMT</pubDate></item><item><title>分享一个全网最全的SLAM领域常用数据集汇总网站</title><link>https://www.zhihu.com/tardis/bd/art/498093992</link><description>与诸位SLAM爱好者们分享一个更新中的网站，该网站汇总了SLAM领域中常用的数据集，并根据SLAM研究中的细分领域和数据集特性做了分类。可以说是全网最全面、最有价值的SLAM数据集汇总了。网站链接见文章末尾。 最强的是，该网站整理出了详细的表格，配合EXCEL的筛选功能，可以一目了然地找到 ...</description><pubDate>Wed, 01 Apr 2026 15:12:00 GMT</pubDate></item><item><title>如何理解Benchmarks？ - 知乎</title><link>https://www.zhihu.com/question/309449176</link><description>如何理解Benchmarks？ 在读The kitti benchmarks suite文章中，不知道benchmark倒是是什么意思？ 是数据集的意思吗？ 和dataset有什么区别？ 显示全部 关注者 75 被浏览</description><pubDate>Thu, 02 Apr 2026 23:25:00 GMT</pubDate></item><item><title>研究生毕设做深度学习相关课题但没有数据集怎么办？ - 知乎</title><link>https://www.zhihu.com/question/433685725</link><description>2. Dataset Ninja: Curated Datasets for Computer Vision 这是一个高质量的图像领域的数据集网站，涵盖 目标检测 、图像分割，农业医学都有，并且全部都有精细标注，但是数据集的数量相对较少，如果做毕业论文，水水小论文，我觉得直接用里面的数据集还是没问题的。</description><pubDate>Fri, 03 Apr 2026 05:09:00 GMT</pubDate></item><item><title>PyTorch Dataset的shuffle与不shuffle：为何会产生显著差异？</title><link>https://www.zhihu.com/question/4304224360</link><description>PyTorch Dataset的shuffle与不shuffle：为何会产生显著差异？ PyTorch Dataset的shuffle与不shuffle：为何会产生显著差异？ 如何选择shuffle参数？ 显示全部 关注者 11 被浏览</description><pubDate>Tue, 17 Mar 2026 18:08:00 GMT</pubDate></item><item><title>深度学习多通道并行的输入的dataset怎么编写啊？ - 知乎</title><link>https://www.zhihu.com/question/608154783</link><description>深度学习多通道并行的输入的dataset怎么编写啊？ 对于一个深度学习网络，我想要每次同时输入多张图片进行识别分类，到这个dataset这里卡住了，不知道怎么改写dataset和图片文件应该怎么放置，有过… 显示全部 关注者 2 被浏览</description><pubDate>Tue, 17 Mar 2026 02:16:00 GMT</pubDate></item><item><title>想用深度学习做绝缘子缺陷检测，但是缺乏数据集，请问有比较权威的绝缘子缺陷数据集吗？ - 知乎</title><link>https://www.zhihu.com/question/284411322</link><description>目前用于绝缘子识别及缺陷检测的数据集仅有CPLID（China power line insulator dataset）、ID（insulator dataset）、OPDL（overhead power distribution lines）、UPID（unifying public insulator dataset）、SFID（synthetic foggy insulator dataset）、IDID（insulator defect image dataset）等，绝缘子开源数据集相关信息见附表3。与ImageNet、PASCAL VOC ...</description><pubDate>Thu, 02 Apr 2026 02:32:00 GMT</pubDate></item></channel></rss>