WhisperKit [译]
我们于 2023 年 11 月成立 Argmax,旨在赋能全球开发者和企业在用户设备上部署商业规模的推理工作负载。对生产环境中 Whisper 推理需求的快速增长促使我们将其作为我们的首个项目。 今天,我们非常激动地宣布,WhisperKit 项目测试版已在 MIT 许可下开源! Swift 包:只需两行代码,即可在应用中实现 Whisper 推理。 ...
我们于 2023 年 11 月成立 Argmax,旨在赋能全球开发者和企业在用户设备上部署商业规模的推理工作负载。对生产环境中 Whisper 推理需求的快速增长促使我们将其作为我们的首个项目。 今天,我们非常激动地宣布,WhisperKit 项目测试版已在 MIT 许可下开源! Swift 包:只需两行代码,即可在应用中实现 Whisper 推理。 ...
在 OpenAI 的工作让我深刻感受到,社会经济的巨变将比我们想象的来得更快。具备思考和学习能力的软件未来将承担越来越多现在由人类完成的工作。这意味着更多的权力将从劳动转移到资本。如果公共政策不能适时调整,大多数人的生活可能会变得更差。 我们需要构建一个体系,它能顺应这种技术未来,并对那些在未来世界中占据大部分价值的资产——如公司和土地——征税,以便公平分配即将涌现的财富。这将使未来社会减...
Swift 5.9 为这门语言引入了强大的观测工具,但遗憾的是,这些工具仅在 iOS 17、macOS 14、tvOS 17、watchOS 10 及更新版本上可用。然而,据统计,不到 50% 的设备升级到了 iOS 17,这意味着多数开发者还需要等上几年才能使用这些工具。 因此,我们对这些观测工具进行了回溯兼容处理,使它们可以在早至 iOS 13、macOS 10.15、tvOS 13、...
开篇先说,这篇文章并不是对大语言模型(LLM)的回顾。显然,2023 年对人工智能是个特别的年份,再次强调似乎多余。相反,这篇文章旨在分享一个程序员的亲身体验。自从 ChatGPT 问世,再到后来使用本地运行的 LLM,我大量利用了这项新技术。主要目的是提高编码效率,但不止于此。我也希望减少在编程中那些既费时又无趣的部分,比如漫长地搜索文档、学习复杂的 API,以及编写几小时后就弃用的程序。...
真实声音克隆(RVC)是一种声音转换模型,能将任何输入声音转换成目标声音。以下是使用该技术的一个示例:摩根·弗里曼扮演汉尼拔·莱克特。 在本文中,我们将展示如何在 Replicate 上创建你自己的 RVC 声音模型。我们将创建数据集,调整模型,然后使用 Replicate 制作一些示例。 步骤概览 创建训练数据集:使用 zsxkib/create-rvc-dataset 模型从...
概览 Assistants API 允许您在自己的应用程序中构建 AI Assistant。一个 Assistant 有自己的指令 (instructions) ,并且可以利用模型 (models)、工具 (tools) 和 知识库 (knowledge) 来回应用户查询。目前,Assistants API 支持三种类型的工具:Code Interpreter(代码解释器)、Retriev...
引言:探究 SwiftUI 的设计哲学 在 SwiftUI 的世界里,Struct 成为了构建视图的首选方式,这与 UIKit 和其他传统 UI 框架有着明显的不同。这样的设计选择并非偶然,而是有着深思熟虑的理由。本文将从多个维度深入探讨这一话题。 一、性能因素:Stack 和 Heap 的内存分配 1.1 Stack 和 Heap:两种内存存储方式 Stack(栈)和 Heap(堆...
本文探讨了 LLM 应用中的文本分块策略,强调了选择适当的分块大小和方法的重要性,以提高效率和准确性。内容覆盖了不同分块方法的优缺点和实施方式,包括固定大小分块和内容感知分块,并提供了 Python 代码示例。文章还提供了几个考虑因素,以帮助读者为其特定应用确定最佳分块策略。最后,总结了分块策略的灵活性和重要性。
本文介绍了向量搜索(vector search)的概念和优势,并详细解释了如何在 MongoDB Atlas 中设置和使用向量搜索。向量搜索允许用户基于数据的语义进行搜索,而不仅仅是基于关键字。这种技术使用机器学习模型将文本、音频、图像等数据转换为高维向量,从而捕获数据的语义含义。文章还详细介绍了如何在 MongoDB Atlas 集群中设置向量搜索,包括创建帐户、构建新集群、创建集合、设置...