support dlrm eager train by ShawnXuan · Pull Request #382 · Oneflow-Inc/models

ShawnXuan · 2022-08-29T03:52:48Z

No description provided.

guo-ran · 2022-09-02T07:50:48Z

RecommenderSystems/dlrm/dlrm_eager_train_eval.py

+        save_model("initial_checkpoint")
+
+    opt = flow.optim.SGD(dlrm_module.parameters(), lr=args.learning_rate)
+    lr_scheduler = make_lr_scheduler(args, opt)


Suggested change

lr_scheduler = make_lr_scheduler(args, opt)

lr_scheduler = make_lr_scheduler(args, opt)

opt = flow.one_embedding.Optimizer(

opt, embeddings=[dlrm_module.embedding.one_embedding]

)

guo-ran · 2022-09-02T07:51:03Z

RecommenderSystems/dlrm/eager_train.sh

+test_case=g${num_gpus}_lr${lr}_t${train_batches}_b${train_batch_size}_d${decay_batches}
+echo $test_case
+
+export ONEFLOW_ONE_EMBEDDING_EAGER=1


Suggested change

export ONEFLOW_ONE_EMBEDDING_EAGER=1

MARD1NO · 2022-10-08T08:28:45Z

RecommenderSystems/dlrm/dlrm_eager_train_eval.py

+
+    opt = flow.optim.SGD(dlrm_module.parameters(), lr=args.learning_rate)
+    lr_scheduler = make_lr_scheduler(args, opt)
+    loss_fn = flow.nn.BCEWithLogitsLoss(reduction="none").to("cuda")


这里应该reduction直接设置为mean，才有可能用那个bce fuse kernel

support dlrm eager train

3bf1787

guo-ran reviewed Sep 2, 2022

View reviewed changes

MARD1NO reviewed Oct 8, 2022

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support dlrm eager train#382

support dlrm eager train#382
ShawnXuan wants to merge 1 commit intomainfrom
dev_dlrm_eager

ShawnXuan commented Aug 29, 2022

Uh oh!

guo-ran Sep 2, 2022

Uh oh!

guo-ran Sep 2, 2022

Uh oh!

MARD1NO Oct 8, 2022

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

ShawnXuan commented Aug 29, 2022

Uh oh!

guo-ran Sep 2, 2022

Choose a reason for hiding this comment

Uh oh!

guo-ran Sep 2, 2022

Choose a reason for hiding this comment

Uh oh!

MARD1NO Oct 8, 2022

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants