OpenFE与Featuretools自动特征工程简介

OpenFE与Featuretools自动特征工程简介 OpenFE 与 Featuretools 都属于「自动特征工程」工具，但面向的数据形态与方法论不同：前者专注单表 tabular，用算子组合 + 以模型效果为导向的筛选造特征（ICML 2023，Kaggle IEEE-CIS 等赛题有公开验证）；后者专注多表关系数据，用深度特征合成（DFS）沿实体关系做聚合与变换。本文概括二...

2026/07/28 AI, ML

机器学习超参数搜索策略与贝叶斯优化简介

机器学习超参数搜索策略与贝叶斯优化简介训练机器学习模型时，除算法选型外，超参数（树深度、学习率、正则系数等）往往决定最终效果。本文归纳常见超参数搜索策略——从固定配置、网格/随机搜索，到贝叶斯优化与 sklearn 内置 CV 估计器；说明各自原理、适用场景、落地成本与选型建议。不涉及特定业务系统，以表格分类与 scikit-learn 生态为主。目录 1. 超参...

2026/07/28 AI, ML

HyperFrames视频引擎简介

HyperFrames视频引擎简介 HyperFrames 是 HeyGen 开源的 HTML 原生视频引擎：用 HTML、CSS、可寻址动画与媒体素材描述成片，经无头 Chrome 逐帧截取 + FFmpeg 编码输出确定性 MP4。面向 AI 编程代理（Cursor、Claude Code 等）的 Vibe-Coding 视频创作是其主要卖点之一。本文基于官方仓库、文档站与社区站...

2026/07/14 后端, 音视频

多标签分类多算法选型与差异性比对

多标签分类多算法选型与差异性比对在多标签分类场景中，若长期仅使用单一梯度提升树模型，业务方常会关心：低排名特征是否被「埋没」、能否引入其他算法提升指标，以及能否在同一套特征底座上并行训练并手工切换推理模型。本文基于 Binary Relevance（BR）架构下的工程实践讨论，对常见算法的归纳偏置差异、特征可解释性、SHAP 接入成本与推荐组合做系统性比对。目录问题...

2026/07/09 AI, ML

MoneyPrinterTurbo视频生成流程简介

MoneyPrinterTurbo视频生成流程简介 MoneyPrinterTurbo 是一款开源（MIT）的 Python 短视频自动化工具：用户提供一个主题或关键词，系统可自动完成文案撰写、素材检索、配音合成、字幕生成、背景音乐混音与成片导出。本文梳理其任务编排流水线、各阶段能力依赖，并与基于 HTML 模板录屏的 html-video 路线对比「文案如何进入画面」。内容基于公开...

2026/07/07 后端, 音视频

大模型算力指标与推理吞吐评测

大模型算力指标与推理吞吐评测讨论大模型部署性能时，常同时出现 FLOPS（硬件算力）和 tokens/s（推理吞吐）两类数字，二者相关但不可混用。本文从 FLOPs / FLOPS 的概念与硬件意义、吞吐评测常用指标与测法、以及纸面算力与实测速度为何对不上三个维度做综述，面向选型、压测与横向对比前的口径统一，非厂商 benchmark 复现手册。参考与延伸阅读： ...

2026/07/04 AI, LLM

MoE混合专家模型原理

MoE混合专家模型原理 MoE（Mixture of Experts，混合专家）是当前大模型扩展参数量的一条重要路线：总参数量可以很大，但每个 token 前向时只激活其中一小部分「专家」子网络，从而在可控算力下逼近更大稠密模型的效果。本文从 MoE 与稠密模型的差异、专家机制、训练与推理特点、命名规则等维度做技术综述，面向选型与部署前的概念厘清，非训练实操手册。参考与延伸阅读...

2026/07/03 AI, LLM

大模型预训练微调与对齐三阶段

大模型预训练微调与对齐三阶段一篇大模型从「零」到「能用」，通常经历预训练 → 指令微调（SFT）→ 对齐（RLHF / DPO）三段。三段各自往模型里注入的能力并不相同：预训练是事实与语言能力的主战场，SFT 主要教输出格式与指令遵循，对齐则校准价值观与偏好。本文结合三阶段分工、知识类型划分，以及 LIMA 等研究所提出的表层对齐假说，梳理「微调到底能不能注入知识」这一争论背...

2026/07/03 AI, LLM

船舶AIS自动识别系统简介

船舶AIS自动识别系统简介本文介绍海事领域 AIS（Automatic Identification System，自动识别系统）的定位、技术组成及其与物联网的关系。AIS 是船—船、船—岸之间的专用无线电广播识别系统，在现代智慧航运与船联网平台中常作为数据采集的重要来源之一。参考与延伸阅读： ITU-R M.1371（AIS 技术建议书）：https://www....

2026/07/03 后端, iot

html-video技能使用简介

html-video技能使用简介本文介绍 Open Design 出品的 html-video 技能：以 HTML/CSS 动画为画面、Playwright 录屏与 ffmpeg 编码生成 MP4，并可对接 MiniMax 合成旁白与烧录字幕。内容基于实际踩坑与跑通经验整理，路径与业务文案已做抽象化处理，便于在 Cursor Skills 工作区复用。参考与延伸阅读： ...

2026/07/03 AI, skill