智人飞扬

智能时代 [译]

在未来几十年里,我们将能够实现一些在祖辈眼中宛如魔法的事情。 这种现象并非新鲜事,但它将以前所未有的速度加速。纵观历史,人类的能力已经突飞猛进;如今我们能做到的事情,在先人看来简直是天方夜谭。 我们能力的提升并非源于基因的改变,而是得益于比任何个体都更智能、更强大的社会基础设施;从某种重要意义上说,社会本身就是一种高级智能。我们的祖辈及其先人创造并成就了伟大的事业。他们为人类进步搭建...

MobileDiffusion:移动设备上的快速文本到图像生成 [译]

文本到图像的 扩散模型 在根据文本提示生成高质量图像方面表现出卓越的能力。然而,领先的模型特征数以十亿计的参数,因此运行成本高昂,需要强大的台式机或服务器(例如 Stable Diffusion、DALL·E 和 Imagen)。虽然过去一年在 Android 上通过 MediaPipe 和 iOS 上通过 Core ML 进行了推理解决方案的最新进展,但在移动设备上实现快速(不到一秒)的文...

万物摩尔定律 [译]

在 OpenAI 的工作让我深刻感受到,社会经济的巨变将比我们想象的来得更快。具备思考和学习能力的软件未来将承担越来越多现在由人类完成的工作。这意味着更多的权力将从劳动转移到资本。如果公共政策不能适时调整,大多数人的生活可能会变得更差。 我们需要构建一个体系,它能顺应这种技术未来,并对那些在未来世界中占据大部分价值的资产——如公司和土地——征税,以便公平分配即将涌现的财富。这将使未来社会减...

2024 年初 LLM 与编程 [译]

开篇先说,这篇文章并不是对大语言模型(LLM)的回顾。显然,2023 年对人工智能是个特别的年份,再次强调似乎多余。相反,这篇文章旨在分享一个程序员的亲身体验。自从 ChatGPT 问世,再到后来使用本地运行的 LLM,我大量利用了这项新技术。主要目的是提高编码效率,但不止于此。我也希望减少在编程中那些既费时又无趣的部分,比如漫长地搜索文档、学习复杂的 API,以及编写几小时后就弃用的程序。...

使用开源模型克隆你的声音 [译]

真实声音克隆(RVC)是一种声音转换模型,能将任何输入声音转换成目标声音。以下是使用该技术的一个示例:摩根·弗里曼扮演汉尼拔·莱克特。 在本文中,我们将展示如何在 Replicate 上创建你自己的 RVC 声音模型。我们将创建数据集,调整模型,然后使用 Replicate 制作一些示例。 步骤概览 创建训练数据集:使用 zsxkib/create-rvc-dataset 模型从...

为什么 SwiftUI 中的 View 使用 Struct 类型而不是 Class?

引言:探究 SwiftUI 的设计哲学 在 SwiftUI 的世界里,Struct 成为了构建视图的首选方式,这与 UIKit 和其他传统 UI 框架有着明显的不同。这样的设计选择并非偶然,而是有着深思熟虑的理由。本文将从多个维度深入探讨这一话题。 一、性能因素:Stack 和 Heap 的内存分配 1.1 Stack 和 Heap:两种内存存储方式 Stack(栈)和 Heap(堆...

LLM 应用中的分块策略 [译]

在构建与 LLM 相关的应用的背景下,分块是将大块文本分解为更小段落的过程。这是一项基本技术,可以帮助优化我们从向量数据库获得的内容的相关性,一旦我们使用 LLM 来嵌入内容。在本博客文章中,我们将探讨它是否以及如何帮助提高 LLM 相关应用的效率和准确性。 我们知道,我们在 Pinecone 中索引的任何内容都需要先嵌入。分块的主要原因是确保我们嵌入的内容尽可能少的噪声,但仍然具有语义相...