Data engine #37

zxrys · 2024-12-02T16:37:56Z

Add data engine to enable users to build their own DPO dataset.

# Conflicts: # chat.py # muffin/eval/muffin_inference_logp.py

# Conflicts: # pyproject.toml

zxrys · 2024-12-02T16:39:27Z

yiranyyu

Great work! This PR supports automatically generating high-quality preference learning dataset efficiently with RLAIF-V models or other reward models and instruction models.

Still, some of the modification should be further revised before permitted to be merged.

data_engine/README.md

pyproject.toml

omnilmm/train/train_utils.py

omnilmm/model/omnilmm.py

muffin/eval/muffin_inference_logp.py

muffin/data/datasets.py

yiranyyu

Last step, refine the readme to improve the readability.

data_engine/README.md

data_engine/README_zh.md

[upgrade] llava critic init

[fix]

zxrys added 13 commits November 22, 2024 15:51

[upgrade] stage 1 code clean

8dcd127

[upgrade] stage 1 passed

627684d

[upgrade] stage 2 passed

644aecd

[upgrade] stage 3 passed

b510d4b

[upgrade] able to train

3e9c239

[upgrade] fix and readme

9e5e1ae

[upgrade]

cbd51f8

[upgrade]

a2be592

Merge remote-tracking branch 'upstream/main'

36e436f

# Conflicts: # chat.py # muffin/eval/muffin_inference_logp.py

[upgrade]

1271f4e

[upgrade]

d221e20

Merge remote-tracking branch 'upstream/main'

f604e0a

# Conflicts: # pyproject.toml

[upgrade] README add some explanation

21fcd8b

yiranyyu requested changes Dec 3, 2024

View reviewed changes

zxrys and others added 6 commits December 3, 2024 21:58

[upgrade] some simple change

0dbb20f

[upgrade] refactor code

be73e25

[upgrade]

65755eb

[upgrade]

0863ec2

[upgrade]

8cdab04

Merge branch 'RLHF-V:main' into main

1419ee1

yiranyyu requested changes Dec 9, 2024

View reviewed changes

data_engine/README.md Outdated Show resolved Hide resolved

data_engine/README.md Outdated Show resolved Hide resolved

data_engine/README_zh.md Outdated Show resolved Hide resolved

zxrys added 2 commits December 9, 2024 20:23

[upgrade] refine README

0871cd7

Merge remote-tracking branch 'origin/main'

5e8ac54

yiranyyu requested changes Dec 9, 2024

View reviewed changes

data_engine/README_zh.md Outdated Show resolved Hide resolved

zxrys added 5 commits December 9, 2024 22:16

[upgrade] refine README

8c46e3a

[upgrade] minicpm inference

3046b7d

[upgrade] minicpm logps

ebd2e11

[fix]

da511f4

[fix]

b1d6136

zxrys added 11 commits December 12, 2024 20:51

[upgrade] support MiniCPM-V

e57a062

[upgrade] code robustness increase

301a9eb

[upgrade] llava critic init

[upgrade] llava update

5d95832

[fix]

[fix]

d9bfbb4

[upgrade] llava critic gen answer

9593bc1

[fix]

29caf18

[upgrade]

8bd24b9

[fix]

801a3f9

[fix]

eafb108

[upgrade]

6652cac

[fix]

be9ac29

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Data engine #37

Data engine #37

zxrys commented Dec 2, 2024

zxrys commented Dec 2, 2024

yiranyyu left a comment

yiranyyu left a comment

Data engine #37

Are you sure you want to change the base?

Data engine #37

Conversation

zxrys commented Dec 2, 2024

zxrys commented Dec 2, 2024

yiranyyu left a comment

Choose a reason for hiding this comment

yiranyyu left a comment

Choose a reason for hiding this comment