TabTin 是一套革命性的解决方案,通过 AI 驱动的智能抓取技术,
自动将复杂网页内容转换为结构化表格数据,让数据采集变得简单高效。
两种智能抓取模式,满足不同场景需求
默认推荐模式,通过 Schema 推荐、智能抽取和 Workflow 编排,快速完成数据采集任务。支持分页抓取和历史 Schema 复用。
基于 ReAct Agent 的智能模式,在复杂场景或 SpeedCrawl 失败时自动接管,提供更强大的推理和决策能力。
强大的声明式 DSL 配置能力,支持标准抽取、分页抽取等多种场景,通过 StepRegistry 和 WorkflowBuilder 灵活编排。
基于 Electron 的跨平台桌面应用,提供完整的抓取工作区、任务管理、数据导入和历史记录功能。
支持 Electron 和 Web 平台的爬虫引擎集成,提供统一的 API 接口,让核心能力可以在不同环境下运行。
完善的表格数据模型和 UI 组件库,支持多种字段类型、视图管理和数据操作,打造专业的数据管理体验。
从网页到表格,只需简单几步
用户提供需要抓取的网页 URL
Crawl Engine 分析页面结构和内容
AI Extractor 提取结构化数据
ExecutionManager 调度和管理任务
数据存入 TaskStore 并导入表格
网页 → Crawl Engines → AI Extractor → Workflow (ExecutionManager) → TaskStore → 导入表格
基于 Monorepo 的模块化设计
抢先体验 TabTin,让数据采集变得简单高效