当前位置:首页 > 神经网络 > 正文

神经网络训练一般要有多少数据

样本的数目没什么固定的,但是那些写论文的多把训练样本和测试样本的比例设在4:1左右,这个应依据实际情况而定。

每个分类6500条数据。 英文文本分类神经网络分10类大概需要6500条数据集,文本分类是自然语言处理(NLP)在数据科学的许多不同领域中广泛使用的任务之一。

只要你觉得这些数据能把握住你要解决的问题了,够这个问题的学习了,就够了。 几十到上百万都是有可能的。 一般数据多一些更有利于精度。

越多越好,大概二三十组为宜。

为了方便观察数据分布,我们选用一个二维坐标的数据,下面共有4个数据,方块代表数据的类型为1,三角代表数据的类型为0,可以看到属于方块类型的数据有(1,2)和(2,1),属于三角类型的数据有(1,1),(2,2),现在问题是需要在平面上将4个数据分成1和0两类,并以此来预测新的数据的类型。