lidang 立党 (推特中文反诈第一人) on Nostr: ...
在理想状态下,LLM应该首先解决更困难的法律、文书、行政、文学创作等等问题,而绝对不应该是写代码,
而现实中,驱动LLM Agent一点点写代码,反而比那些虚无缥缈的文案工作更简单,
原理很简单:代码语法正确与否,编译器可以检查,用户直接查看功能给予反馈,所以落地反而可能是最快的,
相反, 写法律、写文书、写文档、填表格、文学创作、剧本修改这些工作,给LLM Agent的反馈更漫长、更复杂,而且没有自己修复和沟通的能力,因此这些主观上的文字工作,反而是最困难的。
现在大把大把的AI商业化落地项目,一批纯科技公司反而更倾向于AI写前端、AI辅助代码、AI理解代码,正是因为写代码这件事本身是有quality control的——有unit test,有CI/CD,有QA system,还有各种benchmark去评判你的整套系统,AI就不敢乱来,好就是好,会就是会。
反而是AI写法律、AI写小说、AI填表格、AI当会计、AI写文案,极难获得现实世界的真实反馈和沟通,因此反而没人敢用。
归根到底,因为程序员不敢乱搞,所以AI落地更简单;
而真正商业、法律、表格、财务等工作,因为需要和真实世界的真实大量互动,反而AI落地和替代他们变得很难。
而现实中,驱动LLM Agent一点点写代码,反而比那些虚无缥缈的文案工作更简单,
原理很简单:代码语法正确与否,编译器可以检查,用户直接查看功能给予反馈,所以落地反而可能是最快的,
相反, 写法律、写文书、写文档、填表格、文学创作、剧本修改这些工作,给LLM Agent的反馈更漫长、更复杂,而且没有自己修复和沟通的能力,因此这些主观上的文字工作,反而是最困难的。
现在大把大把的AI商业化落地项目,一批纯科技公司反而更倾向于AI写前端、AI辅助代码、AI理解代码,正是因为写代码这件事本身是有quality control的——有unit test,有CI/CD,有QA system,还有各种benchmark去评判你的整套系统,AI就不敢乱来,好就是好,会就是会。
反而是AI写法律、AI写小说、AI填表格、AI当会计、AI写文案,极难获得现实世界的真实反馈和沟通,因此反而没人敢用。
归根到底,因为程序员不敢乱搞,所以AI落地更简单;
而真正商业、法律、表格、财务等工作,因为需要和真实世界的真实大量互动,反而AI落地和替代他们变得很难。