3w + 星标项目大佬创业：树莓派即可运行大模型

时间：2023-06-27 14:06:55　来源：网络整理　作者：bianji123

高级开发人员终于忍无可忍，开始自己创业。

，今年3月份，我开源了llama.cpp项目，已经破了3万颗星，而且只有8.8k。

这个项目允许开发者在没有GPU的情况下运行Meta的LLaMA模型，即使是在 Pi上运行大型模型也百思特网很容易~

△ 在 M2 Max 上以 40 tok/s 的速度运行 7B LLaMA

它甚至吸引了 Zha 的注意：Meta 也在运行 llama.cpp。

或许是因为反响很大，这位大佬决定拿出背后的核心纯C语言框架ggml来创业：几个月前本来只是一个副业项目。

在正式宣布之前，该公司已获得前 Y 合伙人 Gross 的种子前投资。

消息一出，不少开发商前来祝贺。

其中有一些坚定的支持者：ggml 正在将大型模型引入边缘设备。

没过多久，就有人建议苹果收购它。（狗头）

llama.cpp 作者创业

ggml是一个纯C语言编写的张量库，可以帮助开发者在消费级硬件上运行百思特网大型模型，星数达到4.4k。

由于惊人的加速效果，立即获得了众多开发者的支持。

对了，ggml中的gg恰好是他名字的首字母。

老大哥自己的两个star数上万的项目llama.cpp和.cpp都使用了它。

后者是为自动语音识别模型开发的加速解决方案，可以在 Mac、Linux、iOS、、 Pi 和 Web 上运行。

△ 在树莓派上使用.cpp检测短语音命令

很多初创公司，比如主生活搜索引擎，都采用了这种解决方案。

终端上还同时运行着两个项目。

△ 在单个M1Pro上同时运行4个13B LLaMA+ Small实例

据我个人介绍，ggml张量库有以下特点：

支持16位浮点数；支持整数量化（包括4位、5位、8位）；自动微分；内置优化算法（如ADAM、L-BFGS）；针对Apple芯片设置特定优化；在 x86 架构上使用 AVX / AVX2 ；通过 WASM SIMD 进行 Web 支持；无第三方依赖；运行时零内存分配；支持定向语言输出...

目前这个库及相关项目都是免费开源的，开发过程也完全开放；当然，也不排除出于某些商业目的开发授权项目。

用 C/C++ 重写神经网络代码

而这背后的开发老板也值得一说。

他的个人网站非常简单，抛出了各种开源项目，但没有太多其他内容。看得出来他是一个C/C++的粉丝，并且相信Vim。

此前，他用C/C++语言重写了神经网络推理代码，几乎不依赖其他库，提高了效率。至于llama.cpp，他也是一夜之间就出来了。

此外，他还有一些有趣的项目。

比如检查键盘是否可以通过麦克风窃听、猜测新闻标题、克隆等。

还有一件事

值得一提的是，背后的两位投资人也有点意思。

他们还专门为创业者提供算力集群，只需在网站上申请即可。这波更上一层楼了~

参考链接：

本文地址：https://www.best73.com/zdmzt/270171.html

特别声明：以上内容来源于编辑整理发布，如有不妥之处，请与我方联系删除处理。

上一篇：《暗黑破坏神4》骨矛BD各分支选择及词缀选择指南
下一篇：OpenAI 薪资待遇曝光：软件工程师年薪高达 92.5 万美元

相关资讯 查看更多

最新资讯

时刻报警主机键盘说明书（报警主机键盘布防）

2024-04-26 发布

什么样的智能手机好（智能手机哪种好用又实惠）

2024-04-26 发布

微软平板电脑使用说明（平板微软电脑说明使用方法）

2024-04-26 发布

笔记本电脑能以旧换新（笔记本能旧换电脑新的吗）

2024-04-26 发布

用手机能除去马赛克吗（马赛克手机去除工具哪个最有效）

2024-04-26 发布

蓝牙适配器什么牌子好（蓝牙牌子适配器好用吗）

2024-04-26 发布

小米盒子连接上笔记本（盒子笔记本小米连接上没反应）

2024-04-26 发布

中国电子学会无线电定位技术分会（无线电定位系统）

2024-04-26 发布

手机上怎么看音基360（安卓版音基app）

2024-04-26 发布

自助发卡机拍照验证身份像走过场（自助发卡机拍照验证身份像走过场）

2024-04-26 发布

热门资讯

综合资讯

3w + 星标项目大佬创业：树莓派即可运行大模型

3w + 星标项目大佬创业：树莓派即可运行大模型