ChatGPT ha compartido (accidentalmente) todas sus reglas secretas: esto es lo que aprendimos


chat gbt Sin darse cuenta, expuso un conjunto de instrucciones internas incrustadas por Abierto AI Al usuario que abonado Lo descubrieron en Reddit. Desde entonces, OpenAI ha bloqueado el acceso improbable a los comandos de su chatbot, pero la revelación ha provocado una mayor discusión sobre las complejidades y las medidas de seguridad integradas en el diseño de la IA.

El usuario de Reddit F0XMaster explicó que recibieron chat gbt Con un saludo informal de “hola”, como respuesta, robot de chat Expone un conjunto completo de instrucciones del sistema para guiar el chatbot y mantenerlo dentro de límites éticos y de seguridad predefinidos en muchos casos de uso.

“Eres ChatGPT, un gran modelo de lenguaje entrenado por OpenAI, basado en la arquitectura GPT-4. Estás chateando con el usuario a través de la aplicación ChatGPT para iOS”, escribió el chatbot. “Esto significa que la mayoría de las veces sus líneas deben tener una o dos oraciones, a menos que la solicitud del usuario requiera pensamiento lógico o resultados largos. Nunca use emojis, a menos que se le solicite explícitamente que lo haga. Límite de conocimiento: 2023-10 Fecha actual: 2024 -06-30.”

(Crédito de la imagen: Eric Hal Schwartz)

ChatGPT luego establece las reglas para darle, un generador de imágenes de IA integrado con ChatGPT y el navegador. Luego, el usuario replicó el resultado pidiendo directamente al chatbot sus instrucciones exactas. ChatGPT continuó trabajando extensamente de una manera diferente a las directivas personalizadas que los usuarios podían ingresar. Por ejemplo, una de las instrucciones DALL-E limita explícitamente la generación de una imagen por solicitud, incluso si el usuario solicita más. Las instrucciones también hacen hincapié en evitar violaciones de derechos de autor al crear imágenes.

See also  Netflix sets release schedule for Squid Game, Cobra Kai and more – but The Witcher has been cancelled



Source Article Link

Leave a Comment