Alexander Borzunov
|
ab41223b17
Fix dtype- and device-related client issues (#98)
|
2 年 前 |
Alexander Borzunov
|
11d6ba683c
Make inference, forward, and backward fully fault-tolerant (#91)
|
2 年 前 |
Pavel Samygin
|
50535a8435
Priority tasks (#47)
|
3 年 前 |
Artem Chumachenko
|
ada98a1b37
Add deep prompt inference (#66)
|
3 年 前 |
justheuristic
|
d271b75dd4
Let users specify sequence length instead of assuming 2048 (#52)
|
3 年 前 |
Dmitry Baranchuk
|
11a424837f
integrate mixed-8bit model (#39)
|
3 年 前 |
justheuristic
|
f0c7383181
Implement RemoteSequential slicing and extra repr, add tests (#30)
|
3 年 前 |