今天又把cursor拿出来写点小爬虫,现在在等爬虫跑完。
整个开发流程就是纯粹的面向LLM编程了,我提需求,LLM负责实现,用到的模型主要是claude 3.5 sonnet,也用了一次deepseek r1
cursor官方说他们自己部署了deepseek R1,实际用起来速度并不是太快,感觉也就是5tps左右的样子,嫌太慢就换回claude了。
我觉得随着llm能力的进一步提高,具有更强的推理规划能力的模型出现之后,大部分的开发工作都可以交给大模型了,前端代码的编写可能还需要具有更强视觉推理能力模型发布之后才能比较好地交给ai代劳。
对于个人开发者,要实现某些功能而编写的代码,只要需求明确,非推理模型绝大多数情况下都可以完成。然而对于没有多少实际开发经验的人,想要精准地描述需求也是一件难事,这个时候可以让推理模型(o3/R1)充当中间人(cline基本就是这么做的)来细化人类的需求,然后交给响应速度更快模型就做实际的开发工作
可以这么说:未来,人人都是项目经理
咳咳,今天也算是在重新开工了,下一个项目打算做个agent,具体场景呢,可以说是一个电子化的错题本。这个项目的愿景是让备考的人能更快速的拟合正确答案,进行快速梯度下降,找到局部的loss最低点。(~说了些中二的话,不要在意)
这个项目最重要的我认为还是数据库的设计,也就是除了题目本身记录到数据库之中,还需要别的特征,比如这道题的类型,涉及的知识点,解题的思路(但是往往一道题有很多解法,有的复杂,有的简单)还有一点就是做错的情况下使用的思路。。。
只是记录不是最终目的,在积累足够的样本之后,我们就可以在数据上进行分析,直观地看到什么类型的题目容易错,哪些解题思路(方法)没有熟练掌握等等。。
啊。。。深入思考项目的核心内容之后,感觉最重要的是选取哪些特征,
不太对,其实最最最重要的是数据的积累。
数据、以及如何分析数据(选取特征),二者可以说是缺一不可吧
但是,现在可以大模型的时代,R1的出现让我可以以相当低的成本去试错
上面没说到的一点就是“思路”这种东西是不好量化的,做题除了自己的计算能力之外,另一个就是思路了,不过有了低成本的推理模型(感谢A股,感谢幻方,感谢梁文峰)之后,对于“思路”的分析与改进,我还是比较乐观的。
********分割线********
小黑盒的markdown语法阉割了好多。。一般写这种“小作文”我个人都喜欢用删除线表示内心话,现在不给用,有点难受