Toggle navigation
博客
首页
推荐
标签
轻览
日历
搜索
BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)
LLM
 
指令学习(Instruction Learning)
LLM
 
GRPO(Group Relative Policy Optimization)
LLM
 
TRLX:一个大型语言模型训练的工具
LLM
 
LLM Role Play(大语言模型角色扮演)
LLM
 
CPT(Continual Pre-Training)
LLM
 
分层损失聚类算法
算法
 
Layer Normalization
DNN
 
Normalization
 
pandas实战 pivot_table 指定的顺序展示
pandas
 
MVBench多模态大模型视频理解能力基准
LLM
 
OpenCompass:一个开源的大模型评测体系
LLM
 
DeepSeek
LLM
 
DeepSeek
 
COCO(Common Objects in Context)数据集
数据集
 
连续特征离散化方案
特征工程
 
论文:AlignRec: Aligning and Training in Multimodal Recommendations
多模态
 
小红书
 
pbtxt文件:Protocol Buffers(protobuf)格式的一种文本表示形式
文件格式
 
markdown公式
办公
 
markdown
 
Q-Former技术(Querying Transformer)
Transformer
 
论文:Learned Token Pruning for Transformers
LLM
 
Transformers
 
PEFT(Parameter-Efficient Fine-Tuning)
LLM
 
消费者投诉率(Customer Complaint Rate, CCR)
指标
 
NVIDIA Cosmos世界基础模型平台
LLM
 
NVIDIA
 
Product Quantization(PQ)
机器学习
 
论文:Large Memory Layers with Product Keys
论文
 
论文:Key-Value Memory Networks for Directly Reading Documents 键值记忆网络(KV-MemNN)
论文
 
InstantID图像生成技术
机器视觉
 
Valgrind:一款用于内存调试、内存泄漏检测以及性能分析的软件开发工具
测试
 
论文:The Lazy Neuron Phenomenon: On Emergence of Activation Sparsity in Transformers
论文
 
Transformer
 
论文:Training Compute-Optimal Large Language Models 最优模型缩放结论
论文
 
vditor 显示大纲
vditor
 
Implicit Language Q - Learning(ILQL)
强化学习
 
Speculative decoding(推测性解码)
NLP
 
Transformer
 
Causal Attention(因果注意力)
Attention
 
TFLOPS(teraFLOPS缩写)
硬件
 
指标
 
Gemma 2: Improving Open Language Models at a Practical Size,Grouped Query Attention(GQA机制)
DeepMind
 
高带宽内存(High Bandwidth Memory,HBM)
硬件
 
论文:FSQ - FINITE SCALAR QUANTIZATION: VQ-VAE MADE SIMPLE
VAE
 
论文
 
大模型思维树(Tree of Thoughts,ToT)
LLM
 
模型自我对弈
概念
 
符号逻辑(Symbolic Logic)
数学
 
Claude:由Anthropic公司开发的大型语言模型
LLM
 
DeepSeek V3开源大语言模型
LLM
 
DeepSeek
 
论文:Apollo: An Exploration of Video Understanding in Large Multimodal Models
论文
 
LLM
 
DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding
LLM
 
DeepSeek
 
如何搭建智能体Agent
LLM
 
AttributeError: 'module' object has no attribute '_internal_create_key'
常见问题
 
tf.range
TensorFlow
 
TensorFlow函数
 
tf.sort
TensorFlow
 
TensorFlow函数
 
华为跨域推荐 Enhancing CTR prediction in Recommendation Domain with Search Query Representation
推荐系统
 
华为
 
推荐系统中的全域用户建模
推荐系统
 
«
1
2
…
5
6
7
8
9
10
11
…
48
49
»