印第安纳 | 人机交互|寒地求生
为什么更新慢
忙并且充实的日子就想不到写东西,不爽的时候会更有写作欲望是真的。这个账号写了五六年,不怎么更新的日子基本都是又忙又充实,空下来很少想到会写东西。
最近忙着研究怎么把AI领域新的东西结合到自己的科研里。ChatGPT最近赚足了眼球,业界的朋友们要不很激动、要不很担忧。学界也受到了同等的影响,过去几个月里,我科研计划的变化比之前一年都要多。AI领域的变化还是比HCI快很多。
在科研里,单纯赶潮流并不是一件好事。
一件事、一种技术成为了潮流,说明做的人已经在慢慢增加。这时再“跟上潮流”,等论文投出去,类似的论文投稿大概率已经成为了会议的主流,很难在一堆类似的文章里显示出自己的创新性。或许更好的是培养自己发现技术潜力的敏锐性,找到有潜力的方向,在它成为潮流前发掘出用处和价值。
有了ChatGPT,我会用AI帮我生成博客吗?
不会,起码不完全会。就像我不会雇个助理帮我写日记。
有关AI的一些动作
最近的research主要在人机交互和generative AI交叉的领域,ChatGPT对我的科研内容影响实在很大。
AI和ChatGPT已经有很多人说啦!但如果你们对generative AI还有什么好奇或者问题,欢迎留言告诉我。
我前些天受波士顿朋友邀请,去录了一期有关AI会如何改变设计行业的播客。等正式发布的时候我也会分享在这个账号里。
在MIT附近开车 发现Apple Map对CS楼建模细致入微
今年我拿到了学校Lucy Institute for Data and Society的Lucy Scholar奖学金,会帮助在学校里组织一些面向学生的交叉学科活动。我发起了一项叫Collaboration Hour的聊天活动,主要想把不同学科的本科生、研究生联系在一起,聊聊天、交流交流科研,找找新的项目想法或者合作机会。
月底我们会举办第三次Collaboration Hour,我把主题定为:
”What is our collective responsibility for ensuring ethical use of generative AI?”
(我们如何道德地使用生成式AI模型?)
其实一开始我想的主题很简单,就是作为圣母大学的本科生和研究生,如何在学习、工作中合理地使用generative AI,毕业后的工作又会怎样因为这些新的AI工具改变。但是和Lucy Institute的staff商量后,为了避免老师把我们的活动解读成“教本科生用ChatGPT作弊、讨巧”而引起反对,特地在主题中加上了“道德使用”的内容。
我们也想对活动形式做些改变:在以往单纯聊天的Collboration Hour基础上,我们在一开始会加上半小时的workshop,教大家怎么使用ChatGPT和DALLE 2。虽然我周围的CS学生、老师大部分都已经把ChatGPT变成了生活的一部分,但似乎绝大多数人还并没有用过这些工具。希望给大家这样的机会试用一下之后,有更多人会理解它们的强大和好用、拥抱和使用这项新技术。
昨天在推特上看到康奈尔的老师发起了一个投票,问有多少每周至少写一小时代码的人已经试用过了GitHub CoPilot。居然投票最多的选项是“不用/没听说过”,让我着实大吃一惊。
CoPilot让我写代码的痛苦程度大幅下降,虽然在比较大的repository里效果没有那么理想,但是对于规模小一点、inter-dependency少一点的代码,效果实在太好。像是用pandas分析数据,之前每次写个很简单的功能都要查一堆文档(因为函数名字和用法总是记不住),但CoPilot现在基本可以帮我解决一大半的简单操作,再也不用查文档、复制stack overflow了。
CoPilot这样的工具未来继续发展的话,相信会对写代码的模式有很大的改变。从考虑实现方式、找文档、写代码,到写需求、AI生成代码、理解AI的代码、再debug,程序员有多少工作会像这样改变?相信未来Human-AI interaction很多领域都会有类似这样的问题需要被解答。
但话说回来,Lucy Institute的老师和同学似乎都对这个活动很期待!希望我们能吸引到足够的学生。
怎么就毕不了业了?
我读Human–AI Interaction的PhD快两年了,一直暗暗不安的是,HCI背景的我似乎对AI的理解还不够深入。当年接offer的时候我和老板摊牌:我不会AI。他说没事,你来学就好。
第一年上了节学校的机器学习入门课,懂是懂了点,但大概也只是对每个子领域有了些皮毛的了解。在圣母没有针对博士生很深入的机器学习课,入门课里连transformer都没讲,学的基本都是快十年前的旧技术。去年暑假我给自己定了个目标:2023年前要正儿八经真正学会点AI。于是去看了看斯坦福的CS 224n网课,把guest speaker以外的课都过了一遍,终于对NLP、神经网络和比较新的AI奇技淫巧有了些深入的理解。
我用Midjourney为Lucy Collab Hour生成的海报
一两个月前的一次组会,我听同学讲他项目里在GPT3上用了few shot learning,我看到就开始琢磨,心想这玩意儿有点意思啊。开完会去问了问同学,自己又去网上查了查,打开了最近NLP发展趋势的大门:few shot learning、chain of thought,看完之后,终于有办法和做AI的同学聊上几句了。
这本该是好事,按理来说是更接近PhD毕业了。但进入了AI的思维方式后,突然感觉自己的idea变得同质化了:想到的想法要不别人已经做过了,要不就还暂时没法做。大家科研的速度也极快,和同行直接竞争的感觉也更强烈,总担心自己的想法很快被别人做了。
学校充满宗教色彩的图书馆
我觉得这和AI和HCI两个领域不同的科研方式是有关系的:AI领域以task划分,很多人都在努力用各种方法提升模型在各种task上的性能;但HCI是基于现有的技术基础探索各种和人交互的方式、以及各种交互的影响。HCI明显是更有发散空间、更容易自己挖一个新坑的,也没有AI那么卷。
那怎么办呢?AI很重要,但对我来说,还是做HCI有意思呀。我想怎么也得继续多学学AI,在研究Human-AI interaction的时候,要不结合最新的AI发展、要不就问些不管AI如何发展都会存在的问题。这可能是目前的最好的法子了。
下一期预告
上面这些本来是这期想写的一小部分,但讲着讲着就停不下来了。
本来想写的正题其实是BTS的J Hope和J Cole出的新歌on the street——Cole的歌词实在太好了,想要详细解读一下。分析英文hip hop歌词是我从来没写过的内容,但我觉得很有意思,对想学英语slang和听hip hop的朋友应该也会有帮助。请保持关注!