
Kaggle泰坦尼克号幸存者预测项目实践
Kaggle泰坦尼克号幸存者预测项目实践 Kaggle Titanic: Machine Learning from Disaster 是典型的小规模表格二分类 + Accuracy 评测:样本少、特征混有类别与数值,却足够覆盖特征工程、验证方式、泄漏、集成与调参等通用课题。下文从「该怎么做」的角度整理套路,便于照搬到同类竞赛或工作中的表格建模。 一、推荐的建模迭代顺序 这一类题目...

Kaggle泰坦尼克号幸存者预测项目实践 Kaggle Titanic: Machine Learning from Disaster 是典型的小规模表格二分类 + Accuracy 评测:样本少、特征混有类别与数值,却足够覆盖特征工程、验证方式、泄漏、集成与调参等通用课题。下文从「该怎么做」的角度整理套路,便于照搬到同类竞赛或工作中的表格建模。 一、推荐的建模迭代顺序 这一类题目...

revfactory-harness使用简介 revfactory/harness 是面向 Claude Code 的插件:根据自然语言描述的领域目标,自动生成 多智能体(.claude/agents/)、配套 Skill(.claude/skills/),并按 六种预定义团队架构(流水线、扇入扇出、专家池、生产者-审查者、监督者、层级委派等)组织协作。本文整理 环境要求、插件安装(在线与...

RAGFlow0.25版本更新与记忆工作流简介 本文归纳 RAGFlow 自 v0.20.0 起至 v0.25.0 区间在官方发布说明中的主要功能与重大变更,并单独说明 Memory(记忆) 模块的定位、配置要点与可落地的 Agent 工作流(含文字箭头流程图)。具体子版本与修复项繁多,以官方 Release notes 与各版本 GitHub Release为准;升级前务必阅读对应...

harness概念简介 本文梳理 「Harness」一词在工程语境下的多义性,并结合 OpenAI 提出的 Harness Engineering、社区学习资料与若干开源项目,勾画 AI 编程时代「驭缰工程」相关脉络与延伸阅读方向。 先分清:两个常见的「Harness」 含义 典型代表 说明 ...

OpenAI 与 Anthropic 接口协议差异简述 多数模型聚合网关会同时提供 OpenAI 兼容(如 …/v1)与 Anthropic 兼容(如 …/anthropic)两类入口。两套协议在路径、请求体、鉴权与流式响应上并不相同;分开展示是为了对齐各自官方 SDK 与既有工具链,降低迁移成本,而非单纯的技术能力不足。 目录 1. 两套协议的主要差异 ...

Softmax算法使用简介 Softmax 函数把任意长度的实数向量(常称 logits)唯一地变换为同一长度的向量:各分量在 (0,1) 上,且和为 1,因而常作为多类分类输出层的归一化概率表示。与 Sigmoid 处理二分类或逐元素“概率”不同,Softmax 在类别之间是互斥、竞争的;实现上多配合 对数似然/交叉熵 作损失。在大语言模型中,同一形式还用于下一词分布与注意力权重;采样温...

OpenClaw梦境系统使用介绍 本文整理 OpenClaw 2.x / 2.5 路线上围绕 Dream Engine(梦境 / 记忆抽象系统) 的能力划分、工作流、指令与场景示例。安装方式、子命令与频道行为会随版本迭代变化,以当前环境 openclaw --help 与官方文档为准。 一、2.x 新功能概览 功能模块 关键改进 ...

Z-score标准化与聚类应用 Z-score 标准化(又称标准分)把每个特征上的取值变换为「相对该特征均值偏离了多少个标准差」,使不同量纲、不同尺度的特征在数值上可比。它本身不是聚类「算法」,而是特征预处理中常用的线性尺度变换;在 K-means、高斯混合模型等依赖欧氏距离或二次型距离的聚类前,常与 Min-Max、稳健缩放等方法并列选型。 一、名称由来与在统计中的位置 标准分(...

BIRCH平衡迭代削减聚类层次算法简介 流式与实时聚类:使用 BIRCH 时不必一次加载全量数据;样本按流或按批持续到达,算法只维护有界大小的中间状态——CF 树及其上的聚类特征——并对每条或每批样本执行增量更新。在此形态下,可在数据不断写入的同时完成聚类或准实时聚类。 一、算法定位与全称 BIRCH(Balanced Iterative Reducing and Clusteri...

基于主次特征的群体聚类方案 一、背景与问题 在面向风险识别、运营分析或合规筛查等业务时,常需要对人群进行无监督聚类,形成可解释的「群体」标签,供后续策略与展示使用。 业务侧往往具备先验经验: 一类特征更能反映「行为模式」或「活动强度」——例如通行频次、停留相关指标、时间间隔等(下文统称主特征)。 另一类特征更多描述个体属性,对「是否同类行为模式」的区分度相对较弱,但在解释与...