李沐关于大模型应用及职业发展的分享
前几天看了 李沐 在上海交大做的一个 分享 , 主要分享了他对于大模型的一些看法和他个人的经历。
我很喜欢李沐,技术厉害,看起来比较接地气,录制的 课程 也比较容易看懂。
大模型的应用
下面这张图是他对当前大模型应用的看法。
这里面Simple tasks的定义是一个小时可以完成的任务,Complex tasks指需要一个小时以上的时间才可以完成的任务。
在他看来,文科白领的简单任务,大模型已经可以完成的非常好了,复杂任务可以做,但是效果不是非常好。理科白领的简单任务,大模型可以做,但是效果一般,复杂任务还做不了。对于蓝领的工作,大模型目前还无能为力,这里的蓝领,是指像餐厅的服务员等,大模型还没办法替他们去端盘子。
从我个人的使用经验来看,大模型比他说的要稍微强一点,或者说更有用一点。比如我想要基于Django开发一个后端应用,可以让大模型先规划一下并给出初步的实现逻辑,虽然不能直接使用大模型的输出,但是大体的步骤是没问题的,而且有的时候大模型的输出还会给我一些灵感。
分享过程中,他提到他虽然在AWS干了七年半然后出来创业,但是他用不起AWS,因为太贵了…不得不说,AWS虽然很好用,但确实很贵,我们公司从去年开始也在压缩云上的成本,主要就是AWS,据说一年花了将近1亿美金,太贵了。
只要有足够多的数据,一切都可自动化
关于大模型,李沐还提到了一个我以前没有意识到的观点:
只要有足够多的数据,任何事情都可以被自动化。
仔细想想其实挺可怕的。我们的工作本质上其实就是产生数据,写的代码、注释、文档、工作聊天记录、PPT等等,将来在某个领域,这些数据足够多的时候,我们是不是就会被替代?
打工、读博和创业
李沐还分享了他对于读书(博士)、在公司上班和创业的看法。
从上班、读博士到创业,所需要的驱动力越来越强,否则很难坚持下去。
其中关于在公司上班,他列举了一些优劣势:
对于劣势的最后一点,公司内部上级对下级将世界层层简化,呆的越久,学的越少 深有感触,但是又不完全赞同。
我觉得,如果一家公司或者项目已经进入了稳定阶段,发展的缓慢,那么就真的会呆的越久,学的越少。但是如果一直发展的很快,就还是有机会学到很多新的东西的,而且这种情况下,一般来说薪资也会涨的快一些。
动机的来源
他还分享了关于动机的见解。
我感觉在我们中国人的潜意识里,“欲望”是一个贬义词,一般不太会直接谈这个话题,但是李沐就很直接。他分享说,他早起的时候对于名和利就有非常强烈的欲望,要直面自己的欲望,很多时候,欲望是很好的驱动力。
持续提升自我
他还分享了一个他自己持续提升自我的方法,看完之后感叹厉害的人之所以厉害,是有原因的。
我大概2020年的时候才有一点上面图片中提到的review的意识,但不是定期的,也没有这么完整的思路。以后要向沐神学习。