Toggle navigation
YM博客
首页
推荐
标签
轻览
日历
搜索
Learning to Compress Prompts with Gist Tokens
论文
 
训推效率
 
PLUM:面向工业级生成式推荐的预训练语言模型适配框架
论文
 
GR
 
Talking-Heads Attention 论文总结
Attention
 
Selective Activation Checkpointing(选择性激活检查点,简称 SAC)
训推效率
 
二叉树中的最大路径和
编程题
 
torch.sign
torch函数
 
CLI:Command-Line Interface(命令行界面)工具
编程工具
 
竞价点、出价点、计费点
计算广告
 
SSD(固态硬盘)和 HDD(机械硬盘)
架构
 
那些年近些年工业界里的推荐系统(持续更新)
推荐系统
 
Claude 3 Opus 完全指南(核心能力+使用场景+实操教程)
Claude
 
Bun工具介绍
bun
 
Gemini CLI 完全指南(安装+使用+实战)
cli
 
OpenClaw在AI时代脱颖而出的原因
OpenClaw
 
Pre-Norm vs Post-Norm:Transformer架构中的归一化之争
Transformer
 
开源AI执行网关OpenClaw的技术架构、应用场景与发展展望
OpenClaw
 
Agent Harness
agent
 
如何用jarvis平台设计一个小红书爆款笔记生成团队
jarvis
 
Agent
 
Jarvis:一个Mergeek 开发的 AI 智能体平台,支持用自然语言创建和编排多智能体(Multi-Agent)团队的创意生产力工具
Agent
 
MSE与MAE介绍,mse_loss,导数
机器学习
 
在 macOS 上使用 tkinter 为程序设置图标
桌面程序
 
Python + tkinter 桌面程序在 macOS 上添加应用图标
python
 
桌面程序
 
Multi-Head Mixture-of-Experts
MOE
 
PPO(Proximal Policy Optimization)算法的核心损失函数
损失函数
 
推荐系统精排中ID漂移问题
推荐系统
 
行为特征增强(BFS)
推荐系统
 
论文快读
 
ReAct: Synergizing Reasoning and Acting in Language Models
论文
 
ReAct
 
torch.compile 中最核心的 inductor 后端
torch
 
all2all和allreduce的区别
分布式
 
tkinter 输出框
tkinter
 
Deep Pattern Network for Click-Through Rate Prediction
推荐系统
 
spark spark.sql.files.ignoreCorruptFiles
Spark
 
优化算法中的一阶动量
优化器
 
linux知道PID,怎么看进程在哪个目录运行
linux
 
tf.newaxis
TensorFlow函数
 
torch.triu
pytorch函数
 
tf.linalg.band_part
TensorFlow函数
 
Reinforcement Learning中的transition kernel
强化学习
 
GEMS(Gradient Multi-Subspace Tuning)
S&R
 
CODI:Continuous Chain-of-Thought via Self-Distillation
COT
 
一文读懂对数函数(log函数):从定义到应用的全面解析
数学
 
Think Then Embed: Generative Context Improves Multimodal Embedding
多模态
 
GR
 
连续子数组的和大于等于给定值x的个数
编程题
 
Automated Reasoning(自动推理)
Reasoning
 
推荐系统中序列建模优化的思路和常见模型(DIN、DIEN等)
推荐系统
 
序列建模
 
Memory in the Age of AI Agents: A Survey
Memory Network
 
mHC(Manifold-Constrained Hyper-Connections)
deepseek
 
MLP
 
梯度爆炸和梯度消失
梯度
 
Python @ 矩阵乘法 装饰器语法
python
 
FitNets: Hints for Thin Deep Nets
蒸馏
 
«
1
2
3
4
5
…
58
59
»