fix lib

snwfdhmp · snwfdhmp · commit 20b6e75f1d75 · 2023-08-28T16:23:21.000+02:00
diff --git a/constants.js b/constants.js
@@ -58,4 +58,6 @@ export const MODELS = {
   "bing-creative": { kind: "bing-creative" },
   "bing-balanced": { kind: "bing-balanced" },
   "bing-precise": { kind: "bing-precise" },
+  wlm: { kind: "wlm" },
+  wlm13: { kind: "wlm13" },
 }
diff --git a/lib.js b/lib.js
@@ -7,6 +7,8 @@ import { escapeShell, concatPath } from "./utils.js"
 import { useOpenai, useOpenaiChat } from "./apis/openai/api.js"
 import { useBing } from "./apis/bing/api.js"
 import { useHuggingface } from "./apis/huggingface/api.js"
+import { $ } from "zx"
+$.verbose = false
 dotenv.config()
 
 // directory of this file
@@ -81,38 +83,57 @@ export async function useLlm(args) {
         case "bing-precise":
           completion = await useBing({ print, args })
           break
+        case "wlm":
+        case "wizardlm-7b-uncensored":
+          if (!args.modelWasSet) {
+            args.model = "WizardLM-7B-Uncensored/ggml-model-q4_0.gguf"
+            args.modelContextSize = 4096
+            args.modelWasSet = true
+          }
+        case "wlm13":
+        case "wizardlm-13b":
+          if (!args.modelWasSet) {
+            args.model =
+              "WizardLM-1.0-Uncensored-Llama2-13b/ggml-model-q4_0.gguf"
+            args.modelContextSize = 2048
+            args.modelWasSet = true
+          }
+        case "__wizardlm-anymodel__":
+          const randInt = Math.floor(Math.random() * 1000000)
+          const promptPath = `/tmp/llm-prompt.tmp.${randInt}`
+          await fs.promises.writeFile(promptPath, args.prompt)
+          const basePath = "/Users/snwfdhmp/Dev/workspaces/ai"
+          completion =
+            await $`${basePath}/llama.cpp-custom/main -f "${promptPath}" -m ${basePath}/models/${args.model} -n -2 -c ${args.modelContextSize} -ngl 1 2>/dev/null`
+          completion = completion.stdout
+            .slice(1 + args.prompt.length)
+            .trimStart()
+          print(completion)
+          await fs.promises.unlink(promptPath)
+          break
         default:
           console.log(`model ${args.model} is known but not supported yet`)
           process.exit(1)
           break
       }
     } catch (e) {
-      // if 429 error
-      if (e.message.includes("429")) {
-        if (!args.quiet)
-          console.log(
-            `getCompletion: too many requests (429), waiting ${args.backoff}ms`
-          )
-        await new Promise((resolve) => setTimeout(resolve, args.backoff))
-        return await getCompletion({ ...args, backoff: args.backoff * 2 })
-      }
-      if (e.message.includes("503")) {
-        if (!args.quiet)
-          console.log(
-            `getCompletion: service unavailable (503), waiting ${args.backoff}ms`
-          )
-        await new Promise((resolve) => setTimeout(resolve, args.backoff))
-        return await getCompletion({ ...args, backoff: args.backoff * 2 })
-      }
-      if (e.message.includes("502")) {
+      // handle network errors with backoff
+      const errorHandlers = [
+        { code: 429, message: "too many requests" },
+        { code: 503, message: "service unavailable" },
+        { code: 502, message: "bad gateway" },
+      ]
+      for (const errorHandler of errorHandlers) {
+        if (!e.message.includes(`${errorHandler.code}`)) continue
         if (!args.quiet)
           console.log(
-            `getCompletion: bad gateway (502), waiting ${args.backoff}ms`
+            `getCompletion: ${errorHandler.message} (${errorHandler.code}), waiting ${args.backoff}ms`
           )
         await new Promise((resolve) => setTimeout(resolve, args.backoff))
         return await getCompletion({ ...args, backoff: args.backoff * 2 })
       }
 
+      // default error handler
       console.error(`Error: ${e.message}`)
       console.log(e)
       return
diff --git a/package.json b/package.json
@@ -1,8 +1,8 @@
 {
   "type": "module",
   "name": "llm",
-  "version": "1.0.3",
-  "main": "main.js",
+  "version": "1.0.4",
+  "main": "lib.js",
   "license": "CC-BY-4.0",
   "prettier": {
     "semi": false
@@ -16,6 +16,7 @@
     "dotenv": "^16.1.4",
     "node-fetch": "^3.3.1",
     "openai": "^4.3.0",
-    "yargs": "^17.7.2"
+    "yargs": "^17.7.2",
+    "zx": "^7.2.3"
   }
 }
diff --git a/yarn.lock b/yarn.lock

Original file line number	Diff line number	Diff line change
`@@ -58,4 +58,6 @@ export const MODELS = {`
`58`	`58`	`"bing-creative": { kind: "bing-creative" },`
`59`	`59`	`"bing-balanced": { kind: "bing-balanced" },`
`60`	`60`	`"bing-precise": { kind: "bing-precise" },`
	`61`	`+ wlm: { kind: "wlm" },`
	`62`	`+ wlm13: { kind: "wlm13" },`
`61`	`63`	`}`
Original file line number	Diff line number	Diff line change
`@@ -1,8 +1,8 @@`
`1`	`1`	`{`
`2`	`2`	`"type": "module",`
`3`	`3`	`"name": "llm",`
`4`		`- "version": "1.0.3",`
`5`		`- "main": "main.js",`
	`4`	`+ "version": "1.0.4",`
	`5`	`+ "main": "lib.js",`
`6`	`6`	`"license": "CC-BY-4.0",`
`7`	`7`	`"prettier": {`
`8`	`8`	`"semi": false`
`@@ -16,6 +16,7 @@`
`16`	`16`	`"dotenv": "^16.1.4",`
`17`	`17`	`"node-fetch": "^3.3.1",`
`18`	`18`	`"openai": "^4.3.0",`
`19`		`- "yargs": "^17.7.2"`
	`19`	`+ "yargs": "^17.7.2",`
	`20`	`+ "zx": "^7.2.3"`
`20`	`21`	`}`
`21`	`22`	`}`