—— 欧米锐评人 林木
本文原载于《药明康德》,《西湖欧米》获权转载。
就在昨天,我们或许见证了一个新时代的到来。
延续多个月前ChatGPT的爆火,OpenAI公司于今日推出了新的里程碑——GPT-4。或许用社交媒体上刷屏的一张图,能快速看懂它的强大实力:尽管先前的ChatGPT已能通过律师资格考试,但分数只能说是勉强合格。而如今,GPT-4的得分已能超越90%的人类,可谓彻底进化出了精英的水平。即便申请顶尖名校,它的成绩也完全够格。
在新闻中,OpenAI自豪地说道,GPT-4 “在多种职业和学术标准上”,表现已经达到了人类水平。他们尤其强调,越是复杂的任务,越能彰显出GPT-4的实力。如果只是普通的对话,ChatGPT先前使用的GPT-3.5模型与之相差不大。但在更为进阶的领域,我们可以看到两者的巨大区别。比如在一些标准化的考试中,GPT-4的水平有着极大提升,成绩位于最顶尖的20%之列。
它在语言上也有极大的突破。先前,许多类似的人工智能工具都有些偏科,在使用英文时表现很好,使用其他语言时则表现大打折扣。在GPT-4中,这一瓶颈得到了很好的突破。OpenAI一共测试了26种不同的语言,GPT-4在其中24种语言上的表现要优于GPT-3.5在英语上的表现。换句话说,如果先前ChatGPT在英语对话中的表现曾让你感到惊艳,那么你可以期待在应用新的GPT-4模型后,在使用其他语言上也可以得到类似,甚至更好的体验。
GPT-4的另外一大亮点在于不仅可以接受文字中的信息,还可以理解图片。甚至在理解图片的过程中,顺便也理解了人类的幽默感。比如在一张图中,它不仅回答了每一张图里有什么物件,还指出其荒诞之处在于将一个过时的VGA连接器插到了一个智能手机的充电槽中。在另一张图里,它也能理解在 “移动的出租车上熨烫衣服” 是一件很不寻常的事。
它的读图能力不仅能用于理解幽默,还可以用于进行更学术的应用。比如在提供一张柱状图时,它可以从中抓取关键信息,做出总结并进行进一步的计算分析;而当提供一些论文的截图时,它也能精炼其中的要点,并解释论文图片里的多个不同步骤。
说到创造力,GPT-4也同样表现出色。比如它可以用26个单词总结《灰姑娘》的故事大概,而且每一个单词开始的字母都按A-Z的顺序,不带重复……
说的废话更少……
还有人宣称它的知识储备也更丰富……
—— 欧米锐评人 林木
本文原载于《药明康德》,《西湖欧米》获权转载。
就在昨天,我们或许见证了一个新时代的到来。
延续多个月前ChatGPT的爆火,OpenAI公司于今日推出了新的里程碑——GPT-4。或许用社交媒体上刷屏的一张图,能快速看懂它的强大实力:尽管先前的ChatGPT已能通过律师资格考试,但分数只能说是勉强合格。而如今,GPT-4的得分已能超越90%的人类,可谓彻底进化出了精英的水平。即便申请顶尖名校,它的成绩也完全够格。
在新闻中,OpenAI自豪地说道,GPT-4 “在多种职业和学术标准上”,表现已经达到了人类水平。他们尤其强调,越是复杂的任务,越能彰显出GPT-4的实力。如果只是普通的对话,ChatGPT先前使用的GPT-3.5模型与之相差不大。但在更为进阶的领域,我们可以看到两者的巨大区别。比如在一些标准化的考试中,GPT-4的水平有着极大提升,成绩位于最顶尖的20%之列。
它在语言上也有极大的突破。先前,许多类似的人工智能工具都有些偏科,在使用英文时表现很好,使用其他语言时则表现大打折扣。在GPT-4中,这一瓶颈得到了很好的突破。OpenAI一共测试了26种不同的语言,GPT-4在其中24种语言上的表现要优于GPT-3.5在英语上的表现。换句话说,如果先前ChatGPT在英语对话中的表现曾让你感到惊艳,那么你可以期待在应用新的GPT-4模型后,在使用其他语言上也可以得到类似,甚至更好的体验。
GPT-4的另外一大亮点在于不仅可以接受文字中的信息,还可以理解图片。甚至在理解图片的过程中,顺便也理解了人类的幽默感。比如在一张图中,它不仅回答了每一张图里有什么物件,还指出其荒诞之处在于将一个过时的VGA连接器插到了一个智能手机的充电槽中。在另一张图里,它也能理解在 “移动的出租车上熨烫衣服” 是一件很不寻常的事。
它的读图能力不仅能用于理解幽默,还可以用于进行更学术的应用。比如在提供一张柱状图时,它可以从中抓取关键信息,做出总结并进行进一步的计算分析;而当提供一些论文的截图时,它也能精炼其中的要点,并解释论文图片里的多个不同步骤。
说到创造力,GPT-4也同样表现出色。比如它可以用26个单词总结《灰姑娘》的故事大概,而且每一个单词开始的字母都按A-Z的顺序,不带重复……
说的废话更少……
还有人宣称它的知识储备也更丰富……