将网页内容
智能转换为结构化表格

TabTin 是一套革命性的解决方案,通过 AI 驱动的智能抓取技术,
自动将复杂网页内容转换为结构化表格数据,让数据采集变得简单高效。

🌐 🤖 📊

核心功能特性

两种智能抓取模式,满足不同场景需求

SpeedCrawl 极速抓取

默认推荐模式,通过 Schema 推荐、智能抽取和 Workflow 编排,快速完成数据采集任务。支持分页抓取和历史 Schema 复用。

  • 智能 Schema 推荐
  • 自动分页检测
  • 并发任务调度
  • 历史配置复用
🧠

ThinkCrawl 深度思考

基于 ReAct Agent 的智能模式,在复杂场景或 SpeedCrawl 失败时自动接管,提供更强大的推理和决策能力。

  • 智能策略推理
  • 复杂场景适配
  • 自动故障恢复
  • 学习优化能力
🎯

Workflow 工作流

强大的声明式 DSL 配置能力,支持标准抽取、分页抽取等多种场景,通过 StepRegistry 和 WorkflowBuilder 灵活编排。

  • 声明式配置
  • 可视化编排
  • 分步执行回传
  • 暂停/恢复控制
🖥️

桌面端应用

基于 Electron 的跨平台桌面应用,提供完整的抓取工作区、任务管理、数据导入和历史记录功能。

  • 跨平台支持
  • 本地化存储
  • 实时任务监控
  • 数据导出功能
🔧

多端适配器

支持 Electron 和 Web 平台的爬虫引擎集成,提供统一的 API 接口,让核心能力可以在不同环境下运行。

  • Electron 适配
  • Web 浏览器支持
  • 统一 API 接口
  • 可扩展架构
📊

表格领域模型

完善的表格数据模型和 UI 组件库,支持多种字段类型、视图管理和数据操作,打造专业的数据管理体验。

  • 丰富字段类型
  • 多视图支持
  • React 组件库
  • 状态管理集成

工作原理

从网页到表格,只需简单几步

1

输入网页

用户提供需要抓取的网页 URL

2

智能分析

Crawl Engine 分析页面结构和内容

3

AI 抽取

AI Extractor 提取结构化数据

4

Workflow 编排

ExecutionManager 调度和管理任务

5

导入表格

数据存入 TaskStore 并导入表格

网页 → Crawl Engines → AI Extractor → Workflow (ExecutionManager) → TaskStore → 导入表格

技术架构

基于 Monorepo 的模块化设计

📦 核心包

  • crawl-integration - Electron & Web 爬虫集成
  • crawl-extension - Workflow DSL 和策略编排
  • smartsheet - 表格领域模型
  • smartsheet-ui - React UI 组件库
  • smartsheet-adapter-* - 多端适配器

🖥️ 应用层

  • tabtin-client - Electron 桌面客户端
  • 极速抓取与表格管理
  • React + Zustand 状态管理
  • 与主进程的 IPC 通信
  • 本地数据存储和导出

⚙️ 技术栈

  • 前端:React, TypeScript, Zustand
  • 桌面:Electron, Vite
  • 爬虫:AI-powered Extraction
  • 工具:pnpm, Monorepo
  • 认证:Keytar 安全存储

加入等候名单

抢先体验 TabTin,让数据采集变得简单高效

我们会在产品上线时第一时间通知您