Commonsense/llm.py at main · argolab/Commonsense · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
from openai import OpenAI
import dotenv
import rich
import json
import torch
import numpy as np

dotenv.load_dotenv('.env')

class LLM:
    def __init__(self, prompt='./example_files/prompt.json', model="gpt-4o", question=None, sequences=None, json_model="gpt-4o", prob_model='gpt-3.5-turbo', verbose=False):
        self.json = []

        self.model = model
        self.json_model = json_model
        self.prob_model = prob_model

        self.client = OpenAI()
        # load prompt
        with open(prompt, 'r') as f:
            self.prompt = json.load(f)

        self.prompt_og = self.prompt.copy()

        self.verbose = verbose

        self.current_dialogue = None


        self.current_json = None
        self.var_json = None

        self.cons_json = []

        if 'json_dialogue' in self.prompt:
            self.json_dialogue = self.prompt['json_dialogue'].copy()
        else:
            raise ValueError('No json dialogue provided')

        self.response = None

        self.question = question
        if self.question:
            self.add_condition()

        if sequences is None:
            #self.sequences = [['binq', 'brainq', 'broadq', 'moreq', 'varq'], [None, 'margq', 'pricecondq', 'interactq']]
            self.sequences = [['binq', 'brainq', 'broadq', 'varq'], [None, 'margq', 'pricecondq', 'interactq']]
        else:
            self.sequences = sequences

        self.query_q = None

        self.zero = []
        self.zerojs = []


        self.record = {}
        self.record['mrf'] = {}
        self.record['cot'] = {}
        self.record['zero'] = {}

        self.error = False


    def get_zero(self, ):
        #self.reset()
        question = self.question['Text']
        if 'bins' in self.prompt:
            question += '\n' + self.prompt['bins']
        else:
            question += self.prompt['freebins']
        question += '\n' + 'Provide the probability of each bin for the variable price. Give a definite value.'
        messages = self.chat(self.get_initial_message(version='zero'), question, update=False).copy()
        self.record['zero'] = {}
        self.record['zero']['main dialogue'] = messages.copy()
        messages, prob = self.get_prob(messages[-1]['content'])
        self.record['zero']['probability dialogue'] = messages.copy()
        self.record['zero']['probability'] = prob.tolist()
        return prob


    def set_verbose(self, verbose):
        self.verbose = verbose


    def get_cot(self, sequences=None):
        if 'cot' not in self.record or 'main dialogue' not in self.record['cot']:
            self.button(sequences=sequences, js=False)


        question = self.question['Text']
        question += '\n' + 'Provide the probability of each bin for the variable price. Give a definite value.'
        messages = self.chat(self.record['cot']['main dialogue'], question, update=False).copy()
        self.record['cot']['main dialogue'] = messages.copy()
        #short_mes = messages[:1] + messages[-2:]
        latest, prob = self.get_prob(messages[-1]['content'])
        self.record['cot']['probability dialogue'] = latest.copy()
        self.record['cot']['probability'] = prob.tolist()
        return prob


    def get_prob(self, message):

        messages = []
        messages.append({"role": "system", "content": self.prompt['getprob']})
        messages.append({"role": "user", "content": self.prompt['prob_example_us']})
        messages.append({"role": "assistant", "content": self.prompt['prob_example_as']})
        messages.append({"role": "user", "content": message})
        response = self.client.chat.completions.create(
            model=self.prob_model,
            response_format={ "type": "json_object" },
            temperature=0,
            messages=messages,
        )
        assistant_message = response.choices[0].message.content
        messages.append({"role": "assistant", "content": assistant_message})

        latest = messages.copy()

        try:
            js = json.loads(assistant_message)
            array = np.array(js['Probability'])
        except:
            print('Error: Could not parse JSON')
            self.error = True
            array = None

        return latest, array


    def get_current_dialogue(self):
        if self.current_dialogue is None:
            self.current_dialogue = self.get_initial_message()
        return self.current_dialogue.copy()

    def set_current_dialogue(self, messages):
        self.current_dialogue = messages.copy()


    def get_initial_message(self, version='default'):

        if 'initial_message' not in self.prompt:
            raise ValueError('No initial message provided in prompt.')
        if version not in self.prompt:
            raise ValueError('No version of initial message provided in prompt.')
        tmp = (self.prompt['initial_message'] + self.prompt[version])

        return [{'role': 'system', 'content': tmp}].copy()


    def get_json_dialogue(self):
        return self.json_dialogue.copy()

    def set_json_dialogue(self, messages):
        self.json_dialogue = messages.copy()


    def reset(self):
        self.json = []
        self.current_json = None
        self.var_json = None
        self.current_dialogue = self.get_initial_message()
        self.cons_json = []

    def big_button(self, ):
        self.reset()
        js, query = self.button()
        cot = self.get_cot()
        zero = self.get_zero()
        #self.log()

        return self.record


    def button(self, sequences=None, question=True, js=True, linear=False):
        if sequences is None:
            sequences = self.sequences
        for dialogue in sequences[0]:
            messages = self.continue_from_last(self.prompt[dialogue])

        self.record['mrf']['main dialogue'] = self.get_current_dialogue()
        self.record['cot']['main dialogue'] = self.get_current_dialogue()
        if js:
            self.record['mrf']['json dialogue'] = []

        for dialogue in sequences[1]:
            if dialogue is not None:
                messages = self.continue_from_last(self.prompt[dialogue], update=linear)
                self.record['cot']['main dialogue'] += messages[-2:].copy()
                self.record['mrf'][dialogue] = messages.copy()
            if js:
                messages = self.get_json(new_message=messages[-1]['content'])
                self.record['mrf']['json dialogue'] += messages[-2:].copy()
        if not js:
            return
        if js and question and self.question:
            messages = self.get_json(new_message=self.question['Text'], query=True)
            self.record['mrf']['json dialogue'] += messages[-2:].copy()
            query_q = messages[-1]['content']
            self.record['mrf']['query dialogue'] = messages.copy()
            self.record['mrf']['query'] = query_q
            self.record['mrf']['json'] = self.current_json
            return self.current_json, query_q
        return self.current_json, None


    def get_json(self, new_message=None, temperature=0, query=False):

        messages = self.get_json_dialogue()
        if new_message:
            if not query:
                if not self.current_json:
                    messages.append({"role": "user", "content": '[real][Variables] ' + new_message})
                else:
                    messages.append({"role": "user", "content": '[real][Constraints] ' + new_message})
            else:
                messages.append({"role": "user", "content": '[real][Queries] ' + new_message})


        response = self.client.chat.completions.create(
                model=self.json_model,
                response_format={ "type": "json_object" },
                temperature=temperature,
                messages=messages,
            )

        self.response = response
        # Get the assistant's response
        assistant_message = response.choices[0].message.content

        # Append the assistant's response to the message list
        messages.append({"role": "assistant", "content": assistant_message})

        self.prent(messages[-1:])

        if not self.current_json:
            self.set_json_dialogue(messages.copy())

        current_j = json.loads(assistant_message)

        if not query:
            if not self.current_json:
                self.current_json = current_j.copy()
                if 'Constraints' not in self.current_json:
                    self.current_json['Constraints'] = []
            if not self.var_json:
                self.var_json = current_j['Variables'].copy()
            if 'Constraints' in current_j and len(current_j['Constraints']) > 0:
                self.cons_json += current_j['Constraints'].copy()
                self.current_json['Constraints'] += current_j['Constraints'].copy()

        return messages.copy()


    def continue_from_last(self, new_user_message=None, temperature=0.5, update=True):
        return self.chat(self.get_current_dialogue(), new_user_message, temperature, update=update)


    def chat(self, messages, new_user_message=None, temperature=0.5, update=True):
        """
        Continue the chat with the GPT model.

        :param messages: List of previous messages in the conversation
        :param new_user_message: New message from the user
        :param temperature: Temperature setting for the model (default is 0.5)
        :return: Assistant's response
        """
        # Append the new user message to the message list

        if messages is None:
            messages = self.get_initial_message()
        if new_user_message:
            messages.append({"role": "user", "content": new_user_message})

        messages = messages.copy()

        # Send the updated message list to the API
        response = self.client.chat.completions.create(
            model=self.model,
            response_format={ "type": "text" },
            temperature=temperature,
            messages=messages
        )
        self.response = response
        # Get the assistant's response
        assistant_message = response.choices[0].message.content

        # Append the assistant's response to the message list
        messages.append({"role": "assistant", "content": assistant_message})


        self.prent(messages[-2:])

        if update:
            self.set_current_dialogue(messages.copy())


        return messages.copy()


    def backspace(self, messages=None, cnt=1):
        """
        Remove the last user and assistant message from the list of messages.

        :param messages: List of previous messages in the conversation
        :return: Updated list of messages
        """
        # Remove the last user message
        if messages:
            messages = messages[:-int(cnt*2)]
        else:
            self.set_current_dialogue(self.get_current_dialogue()[:-int(cnt*2)])
            messages = self.get_current_dialogue()

        return messages


    def prent(self, messages):
        if self.verbose:
            for mes in messages:
                print(mes['role'], ":", mes['content'])
                print()
                print()
                print("--------------------------------------------------------------------------------------")
                print()
                print()


    def set_question(self, question):
        self.question = question
        self.add_condition()


    def add_condition(self, place='varq', additional='broadq'):

        exist = False
        #for check in ['Target', 'Condition']:
        #    if check in self.question and len(self.question[check]) > 0:
        #        exist = True
        #if not exist:
        #    return

        text = self.question['Text']
        if place not in self.prompt:
            raise ValueError('No suggested condition insertion place in prompt')
        #self.prompt[place] += ' However, you must also include the following variable and possibly some values (you can add more): \n'

        city_name = "United States"
        for cond in self.question['Condition']:
            if cond['Name'] == 'City':
                city_name = cond['Value']
                break

        for key, promp in self.prompt.items():
            if key != 'json_dialogue':
                self.prompt[key] = promp.replace('United States', city_name)

        self.prompt[additional] += " For example, how can the variables to express and answer the question: " + text + " You should express it with ONLY the variables clearly mentioned in the question without extra assumptions. However, think about how the other variables, serving as latent variables, could help the model make better estimates. "

        if place == 'initial_message':
            self.prompt[place][0]['content'] += ' Specifically, we would like to be able to answer the question: ' + text
        else:
            #self.prompt[place] += ' Specifically, we would like to be able to answer the question: ' + text
            self.prompt[place] += '\nAdditionally without loss of generality, we would like to be able to answer: ' + text
            self.prompt[place] += '\nMake sure that the variables chosen can express this question with existing variable values clearly. Explain how the variables chosen can express the question. '
            """ self.prompt[place] += ' For each of the mentioned conditions, you could either\n' + '\n1. Include variables like: \n'


            for check in ['Target', 'Condition']:
                if check in self.question:
                    for var in self.question[check]:
                        self.prompt[place] += var['Name']
                        if 'Value' in var:
                            self.prompt[place] += ' that can express ' + ', '.join(var['Value']) + '\n'
                        else:
                            self.prompt[place] += '\n'

            self.prompt[place] += 'However, you can choose the variable values as you see fit, e.g. when a_1 and a_2 are mentioned, it may be more reasonable to represent them with a_12, while giving additional values a_3, a_4. This allows us to consider such questions without loss of generality. \n'
            self.prompt[place] += '\n\n2. Restrict the domain of our discussion to those specific scenarios to simplify the problem, especially if it can be leveraged to produce more meaningful variables specific to the scenario. In this case, it will not count towards the maximum amount of variables used. Remember to try to leverage this specific scenario with other possible variables.\n'  """

        if self.verbose:
            print("Modified variable question: ", self.prompt[place])


    def get_variable_json(self):
        ret = []
        for check in ['Target', 'Condition']:
            if check in self.question:
                for tar in self.question[check]:
                    tmp = {}
                    if 'Name' not in tar:
                        print('Error: Variable does not have a name')
                        return None
                    else:
                        tmp['Name'] = tar['Name']
                    if 'Value' in tar:
                        tmp['Value'] = tar['Value']
                    ret.append(tmp)
        ret = {'Variables': ret}
        return ret