博主的解释很有趣, 转载作为收藏
原文出处: https://blog.csdn.net/xuaho0907/article/details/88649141
正经解释
拟合(Fitting)
:就是说这个曲线能不能很好的描述某些样本,并且有比较好的泛化能力。
过拟合(Overfitting)
:就是太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平,不具泛化性,拿到新样本后没有办法去准确的判断。
欠拟合(UnderFitting)
:测试样本的特性没有学到,或者是模型过于简单无法拟合或区分样本。
形象解释
就好比你喜欢一个女生,这个女生有着自己的习性,为了追到这个女生我们经常会去迎合这个女生的习性。比如喝温水有固定的温度、挂电话只能她先挂、出去逛街不能哔哔太累、看书只能用书签不能折页........,这个就是我们学到的‘经验’。但是!万一也许可能这个女生某一天觉得你没有足够关心她每天都忙于自己的事情就和你分手啦.....
然后,当你再找女朋友时,你拿出这些 ‘经验’ 但是好像发现效果并不好,因为每个女生的习性和喜好都不一样,所以你就陷入
过拟合
。
怎么解决过拟合呢?那就是多交几个女朋友(增大训练数据量)啦!多了解一些不同女生的习性和喜好,当你已经把全世界所有女生的习性和喜好都学过之后,还有你追不到的女朋友吗? 但是,现实很残酷的,哪有那么多女朋友来供你学习的,你还可以选择丢弃法(Dropout),就是选择性的学习女朋友的喜好和习性,这样就会有概率学不到只属于她“个人癖好”的部分,你学到的就会更加具有普适性。
如何解释
欠拟合
...,那就简单了,就是你第一个女朋友都没追到,她的习性和喜好你还没能完全掌握。
那么怎么解决欠拟合呢?那就只能提升你自己的人格魅力了(模型复杂度),这个我也没什么资格指点,毕竟我也是凭实力单身多年,想必在座的各位应该都比我厉害。
完美拟合
,当你在追第一个女朋友的时候,你自身有一定的人格魅力(模型复杂度),并且并没有完全去迎合她的习性,毕竟存在 ‘个人癖好’ 这个‘错误’习性,你学到的是有泛化性的女生习性特征,当你用这些特征再去追女生的时候,成功率就很高了!
GPT
过拟合(Overfitting)和欠拟合(Underfitting)是机器学习模型训练中常见的问题。
过拟合指的是模型在训练数据上表现良好,但在新数据上表现较差的情况。这可能是由于模型过于复杂而导致了对训练数据的过度拟合,使其失去了泛化能力。可以将其类比为学生在考试时死记硬背答案,但并没有真正理解所学的知识,在遇到新问题时无法灵活运用。
相反,欠拟合指的是模型无法在训练数据和新数据上都表现良好的情况。这通常是由于模型过于简单或未能很好地捕捉数据的特征而导致的。可以将其类比为学生在考试前仅仅浏览一下书本内容,并没有深入掌握知识点,因此无法应对更加复杂的问题。
为了解决这两个问题,我们需要通过调整模型结构、增加训练数据和使用正则化等方法来平衡模型的复杂度和准确性,使其具有更好的泛化性能。