这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出一切可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然取得了不少人的欣赏,开源没几天,就拿下了 18k+ 的 star,而上周开源不到 48 小时取得 35k+ star 的推特引荐算法,本周也成功打破 50k+ 关卡。

依旧是 AI 热度不减的一周,本周的 AI 专场收录了一个离线生图东西,以及一个自保管 AI 编程帮手。此外,还有 Meta 开源出来的重构版构建体系 buck2 也是大受欢迎,还有随着各类 AI 东西火起来的向量数据库,weaviate 也小小地展露了下头角。

还有比较罕见的东西类使用,一款极简的输入法 rime-ice 也值得一看。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,依据项目 release 时刻分类,发布时刻不超越 14 day 的项目会标示 New,无该标志则说明项目 release 超越半月。因为本文篇幅有限,还有部分项目未能在本文展示,望周知

  • 本文目录
    • 1. 本周特推
      • 1.1 AI 专场
      • 1.2 Meta 开源构建体系:buck2
    • 2. GitHub Trending 周榜
      • 2.1 嵌入式数据库:chroma
      • 2.2 万物皆可分:segment-anything
      • 2.3 流处理:arroyo
      • 2.4 极简输入法:rime-ice
      • 2.5 向量数据库:weaviate
    • 3. HelloGitHub 热评
      • 3.1 GIF 录屏东西:ScreenToGif
      • 3.2 Nginx 可视化管理渠道:nginx-proxy-manager
    • 4. 往期回顾

1. 本周特推

1.1 AI 专场

在这波 AI 热度衰退之前,热点趋势的特推部分会添加一个模块来共享新的 AI 使用。

macOS 跑 SD:MochiDiffusion

主言语:Swift

New MochiDiffusion 内置 Apple 的 Core ML Stable Diffusion 框架,以实现在搭载 Apple 芯片上用极低的内存占用发挥出模型最优性能。部分特性:

  • 可离线生图
  • 高性能,极低的内存占用
  • 图转图,Image2Image
  • 自定义 Stable Diffusion Core ML 模型
  • 无需忧虑损坏模型

GitHub 地址→github.com/godly-devot…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

自保管 AI 编程帮手:tabby

主言语:Python、TypeScript

New 自保管的 AI 编程帮手,可作为 Copilot 的替代品。特性:

  • 无需数据库和云服务;
  • 具有可视化、装备模型和 MLOps 的 Web 界面;
  • 接入 OpenAPI;
  • 消费级别的 GPU 支撑(用不同办法优化的 FP-16 权重加载)

GitHub 地址→github.com/TabbyML/tab…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

1.2 Meta 开源构建体系:buck2

主言语:Rust

Meta 开源的大规模构建体系 buck2 承继于 buck1,可是不同于 buck1 选用 Java 编写,buck2 由 Rust 编写而成。重构 buck1 的想法源自想要供给更快速、更高效的构建服务,buck2 有以下特性:

  • 解耦特定言语规矩,buck2 的核心构建体系没有任何特定的言语规矩,这意味着它有更好的可扩展性。buck2 核心部分用 Rust 编写,言语规矩部分(例如:怎么构建 C++)由 Starklark 编写;
  • 构建体系由单一增量依靠图供给支撑,由此消减多类 bug 并添加并发性;
  • 规矩 API 的规划主要为供给先进的性能特性,以及动态依靠特征;
  • 集成长途履行,能在长途机器履行操作,它选用了同 Bazel 一样的 API,并已经用 Buildbarn 和 EngFlow 进行长途履行测试;
  • 集成虚拟文件体系,不必整仓检测,按需获取文件即可;

GitHub 地址→github.com/facebook/bu…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

2. GitHub Trending 周榜

2.1 嵌入式数据库:chroma

本周 star 增加数:1,200+主言语:Python、TypeScript

Chroma 是一个用于 Python / JavaScript LLM 使用程序的嵌入式数据库,它具有内存快速拜访的优势。它只要 4 个核心函数:

import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()
# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents") 
# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
    documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
    ids=["doc1", "doc2"], # unique for each doc 
)
# Query/search 2 most similar results. You can also .get by id
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

GitHub 地址→github.com/chroma-core…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

2.2 万物皆可分:segment-anything

本周 star 增加数:18,000+主言语:Jupyter Notebook

New 这个代码库供给了使用 SegmentAnything 模型(SAM)进行推理的代码,SAM 是一种输入比如点、框等 prompt 生成高质量目标 mask 的模型,它有非常出彩的标记效果。btw,项目开源不到一周已经有 18k+ star。

GitHub 地址→github.com/facebookres…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

2.3 流处理:arroyo

本周 star 增加数:700+主言语:Rust、TypeScript

New arroyo 是一个 Rust 编写的分布式流处理引擎,旨在高效地对流数据进行状况核算。与传统的批处理不同,流处理引擎能够处理有界和无界数据源,一旦结果可用就立即输出。

GitHub 地址→github.com/ArroyoSyste…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

2.4 极简输入法:rime-ice

本周 star 增加数 1,850+主言语:Go、Lua

雾凇拼音一个极简风的输入法,支撑简体、全拼、双拼。值得一提的事,作者自己保护了一个词库:

  • 8105 字表
  • base 基础词库
  • sogou 搜狗盛行词
  • ext 扩展词库,小词库
  • tencent 扩展词库,大词库
  • Emoji

GitHub 地址→github.com/iDvel/rime-…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

2.5 向量数据库:weaviate

本周 star 增加数:500+主言语:Go

Weaviate 是一个开源的向量数据库,能够存储对象和向量,答应将向量搜索与结构化过滤相结合,并具有云原生数据库的容错性和可扩展性,可经过 GraphQL、REST 和各种言语客户端进行拜访。

GitHub 地址→github.com/weaviate/we…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

3. HelloGitHub 热评

在这个章节,咱们将会共享下本周 HelloGitHub 网站上的热评项目,HG 开源项目点评体系刚上线不久,期待你的点评 :D

3.1 GIF 录屏东西:ScreenToGif

主言语:C#

一款 Windows 上的免费 GIF 录屏东西,易装置、好上手,支撑录制指定区域画面,且能够将视频导出为 gif 等文件格局。

HG 点评地址→hellogithub.com/repository/…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

3.2 Nginx 可视化管理渠道:nginx-proxy-manager

主言语:JavaScript

它开箱即用,支撑 Docker 一键布置,能够让用户经过 Web 界面在线装备、管理 Nginx 服务,支撑转发、重定向、SSL 证书、高级装备等功能。

HG 点评地址→hellogithub.com/repository/…

碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

4. 往期回顾

往期回顾:

  • Python 霸榜的一周,又有什么新 AI 力作呢?「GitHub 热点速览」
  • 开源不到 48 小时获 35k star 的引荐算法「GitHub 热点速览」

以上为 2023 年第 14 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和我们一起共享下哟