智人飞扬

MobileDiffusion:移动设备上的快速文本到图像生成 [译]

文本到图像的 扩散模型 在根据文本提示生成高质量图像方面表现出卓越的能力。然而,领先的模型特征数以十亿计的参数,因此运行成本高昂,需要强大的台式机或服务器(例如 Stable Diffusion、DALL·E 和 Imagen)。虽然过去一年在 Android 上通过 MediaPipe 和 iOS 上通过 Core ML 进行了推理解决方案的最新进展,但在移动设备上实现快速(不到一秒)的文...

万物摩尔定律 [译]

在 OpenAI 的工作让我深刻感受到,社会经济的巨变将比我们想象的来得更快。具备思考和学习能力的软件未来将承担越来越多现在由人类完成的工作。这意味着更多的权力将从劳动转移到资本。如果公共政策不能适时调整,大多数人的生活可能会变得更差。 我们需要构建一个体系,它能顺应这种技术未来,并对那些在未来世界中占据大部分价值的资产——如公司和土地——征税,以便公平分配即将涌现的财富。这将使未来社会减...

2024 年初 LLM 与编程 [译]

开篇先说,这篇文章并不是对大语言模型(LLM)的回顾。显然,2023 年对人工智能是个特别的年份,再次强调似乎多余。相反,这篇文章旨在分享一个程序员的亲身体验。自从 ChatGPT 问世,再到后来使用本地运行的 LLM,我大量利用了这项新技术。主要目的是提高编码效率,但不止于此。我也希望减少在编程中那些既费时又无趣的部分,比如漫长地搜索文档、学习复杂的 API,以及编写几小时后就弃用的程序。...

使用开源模型克隆你的声音 [译]

真实声音克隆(RVC)是一种声音转换模型,能将任何输入声音转换成目标声音。以下是使用该技术的一个示例:摩根·弗里曼扮演汉尼拔·莱克特。 在本文中,我们将展示如何在 Replicate 上创建你自己的 RVC 声音模型。我们将创建数据集,调整模型,然后使用 Replicate 制作一些示例。 步骤概览 创建训练数据集:使用 zsxkib/create-rvc-dataset 模型从...

为什么 SwiftUI 中的 View 使用 Struct 类型而不是 Class?

引言:探究 SwiftUI 的设计哲学 在 SwiftUI 的世界里,Struct 成为了构建视图的首选方式,这与 UIKit 和其他传统 UI 框架有着明显的不同。这样的设计选择并非偶然,而是有着深思熟虑的理由。本文将从多个维度深入探讨这一话题。 一、性能因素:Stack 和 Heap 的内存分配 1.1 Stack 和 Heap:两种内存存储方式 Stack(栈)和 Heap(堆...

LLM 应用中的分块策略 [译]

在构建与 LLM 相关的应用的背景下,分块是将大块文本分解为更小段落的过程。这是一项基本技术,可以帮助优化我们从向量数据库获得的内容的相关性,一旦我们使用 LLM 来嵌入内容。在本博客文章中,我们将探讨它是否以及如何帮助提高 LLM 相关应用的效率和准确性。 我们知道,我们在 Pinecone 中索引的任何内容都需要先嵌入。分块的主要原因是确保我们嵌入的内容尽可能少的噪声,但仍然具有语义相...

使用 Atlas Vector Search 进行语义搜索 [译]

引言 你是否曾经寻找某样东西,但却找不到合适的词汇来描述它?你是否记得一部电影的一些特点,但却记不得它的名字?你是否曾经想要找到一件和你以前拥有的运动衫一样的衣服,但却不知道如何搜索它?你是否在使用大型语言模型,但它们只知道直到 2021 年的信息?你是否想让它跟上时代的步伐?那么,向量搜索可能正是你所寻找的。 什么是向量搜索? 向量搜索是一项功能,允许你进行语义搜索,即基于意义进行数据搜...